王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型

浏览:71次阅读
没有评论

人工智能领域迎来重磅升级——Anthropic 正式推出 Claude 3.7 Sonnet 混合推理模型。提供标准模式和扩展思考模式,允许用户根据需求在速度和质量之间进行平衡。此外 Anthropic 还推出了 Claude Code,一款用于智能编码的命令行工具。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图

1、混合推理模式

不同与其他家的将推理思考和普通响应分为两个不同的模型,Claude 3.7 Sonnet 则是一个模型两种思考方式,将标准模式和扩展思考模式集于一身。

Claude 3.7 Sonnet 的设计理念与市场上其他推理模型有所不同。Anthropic 希望推理不仅仅是单纯的快速反应或深度思考,而是像人类的大脑一样,能在同一个模型中兼具两者,从而带来更无缝的体验。

标准模式 :提供即时响应(毫秒级延迟),适用于日常对话和简单任务,相比前代 Claude 3.5 Sonnet 性能全面优化。

扩展思维模式 :通过自我反思机制生成逐步推理过程(如解决数学问题时展示详细推导步骤),显著提升复杂任务(数学、物理、编码)的准确性,部分领域性能提升超 10%。

用户不需要再选择切换模型,就可以根据自身需求,选择让模型快速响应,或者是在给出答案之前,进行更深层次的推理与分析,甚至 API 用户还能够精细调控模型的思考时长。你可以告诉 Claude 思考不超过 N 个 token,从而允许用户在使用成本和答案质量之间进行权衡。

2、 性能与改进

Claude 3.7 Sonnet 在编码和多模态任务中表现出色,特别是在处理复杂代码库和多步骤任务方面有显著提升。

在 SWE-bench Verified(评估 AI 解决实际软件问题的基准测试)中,扩展模式准确率达 70.3%,远超 OpenAI o1(48.9%)和 DeepSeek R1(49.2%)等模型。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图1

在 TAU-bench(评估 LLM 在复杂真实场景中用户与工具交互能力的基准测试平台)上,Claude 3.7 Sonnet 同样实现了 SOTA 性能,超过了 Claude 3.5 Sonnet 和 OpenAI 的 o1。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图2

Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学方面提供了显著的提升。除了传统的基准测试之外,它甚至在宝可梦游戏测试中超越了所有以前的模型。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图3

3、Claude Code

此外 Anthropic 还推出了 Claude Code,这是一款用于智能编码的命令行工具。目前它作为有限的研究预览版面向开发者开放,开发者可以直接通过终端将复杂的开发任务交给 Claude 处理,用自然语言命令更快地编码,包括执行例行任务、解释复杂代码和处理 git 工作流。

Claude 还进一步改善了 GitHub 的集成体验,使得开发者可以轻松地将自己的代码库与 Claude 相连,进行错误修复、功能开发和文档建设。凭借这些新功能,Claude 3.7 Sonnet 已成为在编码领域的最强的模型。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图4

在技术验证阶段,Claude Code 已展现出突破性效能。通过内部实验数据显示,该工具单次执行即可替代常规环境下耗时超过 45 分钟的手工操作流程,显著压缩研发周期并降低资源投入。

4、 可用性与定价

当前版本 Claude 3.7 Sonnet 已全面开放,用户可以通过所有 Claude 计划(包括 Free、Pro、Team 和 Enterprise)以及 Anthropic API、亚马逊和谷歌云平台使用。除了免费用户之外,所有其他用户均可体验扩展思考模式。

价格方面该版本延续了 Claude 3.5 Sonnet 的定价策略体系。标准运算模式与扩展思考模式均采用统一计价标准:每百万输入 token 3 美元,每百万输出 token 15 美元(包括思考 token)。

国内用户推荐使用这个中转 API 平台(api.hdgsb.com)调用,目前已经上线了最新的 Claude 3.7 Sonnet 模型,与官网同样的计费价格但充值价格却不到官网的一半,确实非常的优惠,需要使用扩展思考模式记得调用 claude-3-7-sonnet-thinking 这个模型

此次发布的 Claude 3.7 Sonnet 与 Claude Code 被 Anthropic 视为具有里程碑意义的技术突破。团队认为,这两项技术展现出的人工智能在复杂决策、多线程任务处理及人机协同方面的突破性进步,标志着 AI 系统正从辅助工具蜕变为真正能延伸人类潜能的数字伙伴。

王炸级新模型!Anthropic 发布 Claude 3.7 Sonnet混合推理模型插图5

Anthropic 勾勒出激动人心的技术演进路线——到 2025 年,Claude 或将进化为能持续自主作业数小时的专业级智能体;而 2027 年的技术迭代目标,则是让 Claude 具备攻克人类团队需耗时数年才能解决的重大挑战的能力。这种技术跃迁将重新定义人机协作的边界,使人工智能真正成为人类认知能力的战略级增强组件。

正文完
 0
评论(没有评论)
验证码