王炸级新模型！Anthropic 发布 Claude 3.7 Sonnet混合推理模型

浏览：210次阅读

人工智能领域迎来重磅升级——Anthropic 正式推出 Claude 3.7 Sonnet 混合推理模型。提供标准模式和扩展思考模式，允许用户根据需求在速度和质量之间进行平衡。此外 Anthropic 还推出了 Claude Code，一款用于智能编码的命令行工具。

1、混合推理模式

不同与其他家的将推理思考和普通响应分为两个不同的模型，Claude 3.7 Sonnet 则是一个模型两种思考方式，将标准模式和扩展思考模式集于一身。

Claude 3.7 Sonnet 的设计理念与市场上其他推理模型有所不同。Anthropic 希望推理不仅仅是单纯的快速反应或深度思考，而是像人类的大脑一样，能在同一个模型中兼具两者，从而带来更无缝的体验。

标准模式 ：提供即时响应（毫秒级延迟），适用于日常对话和简单任务，相比前代 Claude 3.5 Sonnet 性能全面优化。

扩展思维模式 ：通过自我反思机制生成逐步推理过程（如解决数学问题时展示详细推导步骤），显著提升复杂任务（数学、物理、编码）的准确性，部分领域性能提升超 10%。

用户不需要再选择切换模型，就可以根据自身需求，选择让模型快速响应，或者是在给出答案之前，进行更深层次的推理与分析，甚至 API 用户还能够精细调控模型的思考时长。你可以告诉 Claude 思考不超过 N 个 token，从而允许用户在使用成本和答案质量之间进行权衡。

2、性能与改进

Claude 3.7 Sonnet 在编码和多模态任务中表现出色，特别是在处理复杂代码库和多步骤任务方面有显著提升。

在 SWE-bench Verified（评估 AI 解决实际软件问题的基准测试）中，扩展模式准确率达 70.3%，远超 OpenAI o1（48.9%）和 DeepSeek R1（49.2%）等模型。

在 TAU-bench（评估 LLM 在复杂真实场景中用户与工具交互能力的基准测试平台）上，Claude 3.7 Sonnet 同样实现了 SOTA 性能，超过了 Claude 3.5 Sonnet 和 OpenAI 的 o1。

Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色，扩展思维在数学和科学方面提供了显著的提升。除了传统的基准测试之外，它甚至在宝可梦游戏测试中超越了所有以前的模型。

3、Claude Code

此外 Anthropic 还推出了 Claude Code，这是一款用于智能编码的命令行工具。目前它作为有限的研究预览版面向开发者开放，开发者可以直接通过终端将复杂的开发任务交给 Claude 处理，用自然语言命令更快地编码，包括执行例行任务、解释复杂代码和处理 git 工作流。

Claude 还进一步改善了 GitHub 的集成体验，使得开发者可以轻松地将自己的代码库与 Claude 相连，进行错误修复、功能开发和文档建设。凭借这些新功能，Claude 3.7 Sonnet 已成为在编码领域的最强的模型。

在技术验证阶段，Claude Code 已展现出突破性效能。通过内部实验数据显示，该工具单次执行即可替代常规环境下耗时超过 45 分钟的手工操作流程，显著压缩研发周期并降低资源投入。

4、可用性与定价

当前版本 Claude 3.7 Sonnet 已全面开放，用户可以通过所有 Claude 计划（包括 Free、Pro、Team 和 Enterprise）以及 Anthropic API、亚马逊和谷歌云平台使用。除了免费用户之外，所有其他用户均可体验扩展思考模式。

价格方面该版本延续了 Claude 3.5 Sonnet 的定价策略体系。标准运算模式与扩展思考模式均采用统一计价标准：每百万输入 token 3 美元，每百万输出 token 15 美元（包括思考 token）。

国内用户推荐使用这个中转 API 平台（api.hdgsb.com）调用，目前已经上线了最新的 Claude 3.7 Sonnet 模型，与官网同样的计费价格但充值价格却不到官网的一半，确实非常的优惠，需要使用扩展思考模式记得调用 claude-3-7-sonnet-thinking 这个模型

此次发布的 Claude 3.7 Sonnet 与 Claude Code 被 Anthropic 视为具有里程碑意义的技术突破。团队认为，这两项技术展现出的人工智能在复杂决策、多线程任务处理及人机协同方面的突破性进步，标志着 AI 系统正从辅助工具蜕变为真正能延伸人类潜能的数字伙伴。

Anthropic 勾勒出激动人心的技术演进路线——到 2025 年，Claude 或将进化为能持续自主作业数小时的专业级智能体；而 2027 年的技术迭代目标，则是让 Claude 具备攻克人类团队需耗时数年才能解决的重大挑战的能力。这种技术跃迁将重新定义人机协作的边界，使人工智能真正成为人类认知能力的战略级增强组件。

正文完