人工智能领域迎来重磅升级——Anthropic 正式推出 Claude 3.7 Sonnet 混合推理模型。提供标准模式和扩展思考模式,允许用户根据需求在速度和质量之间进行平衡。此外 Anthropic 还推出了 Claude Code,一款用于智能编码的命令行工具。

1、混合推理模式
不同与其他家的将推理思考和普通响应分为两个不同的模型,Claude 3.7 Sonnet 则是一个模型两种思考方式,将标准模式和扩展思考模式集于一身。
Claude 3.7 Sonnet 的设计理念与市场上其他推理模型有所不同。Anthropic 希望推理不仅仅是单纯的快速反应或深度思考,而是像人类的大脑一样,能在同一个模型中兼具两者,从而带来更无缝的体验。
标准模式 :提供即时响应(毫秒级延迟),适用于日常对话和简单任务,相比前代 Claude 3.5 Sonnet 性能全面优化。
扩展思维模式 :通过自我反思机制生成逐步推理过程(如解决数学问题时展示详细推导步骤),显著提升复杂任务(数学、物理、编码)的准确性,部分领域性能提升超 10%。
用户不需要再选择切换模型,就可以根据自身需求,选择让模型快速响应,或者是在给出答案之前,进行更深层次的推理与分析,甚至 API 用户还能够精细调控模型的思考时长。你可以告诉 Claude 思考不超过 N 个 token,从而允许用户在使用成本和答案质量之间进行权衡。
2、 性能与改进
Claude 3.7 Sonnet 在编码和多模态任务中表现出色,特别是在处理复杂代码库和多步骤任务方面有显著提升。
在 SWE-bench Verified(评估 AI 解决实际软件问题的基准测试)中,扩展模式准确率达 70.3%,远超 OpenAI o1(48.9%)和 DeepSeek R1(49.2%)等模型。

在 TAU-bench(评估 LLM 在复杂真实场景中用户与工具交互能力的基准测试平台)上,Claude 3.7 Sonnet 同样实现了 SOTA 性能,超过了 Claude 3.5 Sonnet 和 OpenAI 的 o1。

Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学方面提供了显著的提升。除了传统的基准测试之外,它甚至在宝可梦游戏测试中超越了所有以前的模型。

3、Claude Code
此外 Anthropic 还推出了 Claude Code,这是一款用于智能编码的命令行工具。目前它作为有限的研究预览版面向开发者开放,开发者可以直接通过终端将复杂的开发任务交给 Claude 处理,用自然语言命令更快地编码,包括执行例行任务、解释复杂代码和处理 git 工作流。
Claude 还进一步改善了 GitHub 的集成体验,使得开发者可以轻松地将自己的代码库与 Claude 相连,进行错误修复、功能开发和文档建设。凭借这些新功能,Claude 3.7 Sonnet 已成为在编码领域的最强的模型。

在技术验证阶段,Claude Code 已展现出突破性效能。通过内部实验数据显示,该工具单次执行即可替代常规环境下耗时超过 45 分钟的手工操作流程,显著压缩研发周期并降低资源投入。
4、 可用性与定价
当前版本 Claude 3.7 Sonnet 已全面开放,用户可以通过所有 Claude 计划(包括 Free、Pro、Team 和 Enterprise)以及 Anthropic API、亚马逊和谷歌云平台使用。除了免费用户之外,所有其他用户均可体验扩展思考模式。
价格方面该版本延续了 Claude 3.5 Sonnet 的定价策略体系。标准运算模式与扩展思考模式均采用统一计价标准:每百万输入 token 3 美元,每百万输出 token 15 美元(包括思考 token)。
国内用户推荐使用这个中转 API 平台(api.hdgsb.com)调用,目前已经上线了最新的 Claude 3.7 Sonnet 模型,与官网同样的计费价格但充值价格却不到官网的一半,确实非常的优惠,需要使用扩展思考模式记得调用 claude-3-7-sonnet-thinking 这个模型
此次发布的 Claude 3.7 Sonnet 与 Claude Code 被 Anthropic 视为具有里程碑意义的技术突破。团队认为,这两项技术展现出的人工智能在复杂决策、多线程任务处理及人机协同方面的突破性进步,标志着 AI 系统正从辅助工具蜕变为真正能延伸人类潜能的数字伙伴。

Anthropic 勾勒出激动人心的技术演进路线——到 2025 年,Claude 或将进化为能持续自主作业数小时的专业级智能体;而 2027 年的技术迭代目标,则是让 Claude 具备攻克人类团队需耗时数年才能解决的重大挑战的能力。这种技术跃迁将重新定义人机协作的边界,使人工智能真正成为人类认知能力的战略级增强组件。