地表最强编程 AI:Claude 4 系列登场,自动写代码

2025-05-23 07:13:38

  Anthropic 公司在北京时间今天 0 点 30 分举办的活动中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代语言模型,援引博文介绍,Claude Opus 4 被定位为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。

  测试数据显示,该模型在 SWE-bench 基准测试中准确率达到 72.5%;在 TerminalBench 测试中准确率为 43.2%。

  更令人瞩目的是,Opus 4 在软件环境中展现出强大的自主行为,得益于改进的内存管理、更广泛的上下文保留以及更强大的内部规划机制,据 Rakuten 测试数据,Anthropic 声称,其 AI 模型不是为了消除工作岗位,而是一种将日常工作自动化的工具。不过 marktechpost媒体认为,Claude 4系列问世后,将改变AI的使用方式,让AI从完成单一任务的辅助工具,转换为具备更强、更广泛功能的“AI同事”,Claude Sonnet 4 取代了前代 Claude 3.5 Sonnet,以更稳定的架构提升速度与质量,同时未显著增加计算成本。该模型针对中规模部署优化,适合需要在成本与性能间权衡的场景。

  尽管推理能力不及 Opus 4,但 Sonnet 4 继承了许多架构升级,支持多文件代码导航、中间工具使用和结构化文本处理,延迟表现更佳。它成为 Claude.ai 免费用户的默认模型,并通过 API 提供服务,适用于轻量开发工具、用户助手和分析流程。

  两款模型均具备混合推理能力,提供“快速模式”用于低延迟的简短对话任务,以及“扩展思考模式”用于需要深度推理和多轮代理行为的复杂任务。

  这种双模式策略让用户能根据任务复杂度灵活分配计算资源。此外,Claude Opus 4 和 Sonnet 4 可通过 Anthropic 的 Claude API、Amazon Bedrock 和 Google Cloud Vertex AI 等多个云平台访问,支持从自主代理到代码分析等多种企业应用场景。

下一篇:FAA 宣布完成既往事故调查,SpaceX 星舰第九次试飞
上一篇:2025年《财富》全球最具影响力的商界女性榜单发
返回顶部小火箭