Claude 3.7 Sonnet发布：双思维模式提升推理能力，挑战DeepSeek与o3

2025-02-25 07:11:40 1214 大屏时代

2025年2月25日，Anthropic发布了其最新的大型语言模型——Claude 3.7 Sonnet，标志着人工智能领域的又一次重要突破。这一版本的Claude带来了革命性的“标准”和“扩展”双思维模式，使得模型的推理能力和透明度大幅提升，尤其在复杂任务和代码分析上表现出色。

9DEF81E20272A36E5CC96052C40C8EAD7994C7C9_size75_w1015_h598.jpg

双思维模式：标准与扩展思维的结合

Claude 3.7 Sonnet引入了两种思维模式：标准思维和扩展思维。标准思维能够快速回答简单问题，如“巴黎的埃菲尔铁塔有多高？”这样的查询，系统能立刻提供324米的答案。扩展思维模式则更为复杂，模拟人类的推理过程，逐步分析并展示详细的思考过程，适用于需要深度逻辑推理的领域，如数学和生物学。

扩展思维模式不仅提升了模型在数学、逻辑推理等科研领域的表现，还增强了模型的透明度。通过呈现详细的推理链，用户可以清楚看到模型如何得出结论，这对于科研人员及开发者在进行问题分析时非常有帮助。此外，用户还能通过API精确控制模型的思考时间，进一步提高工作效率。

25EE8176DF978366474A72029B3C10E6DB5911BD_size77_w554_h560.jpg

推理能力大幅超越DeepSeek和o3

根据SWE Bench测试数据，Claude 3.7 Sonnet的代码能力在多个领域大幅超过了DeepSeek-R1、OpenAI的o1和o3等同行模型。Claude 3.7在MMMLU、Math500等多个专业测试中表现出色，尤其在代码生成与复杂推理任务中，其推理步骤的质量得到了显著提升。这使得Claude 3.7成为开发者和科研人员的重要工具，特别是在需要精确和透明推理过程的场景中。

F5D9684DF6C2BDCF549D662A558D16EB18337E59_size201_w554_h457.jpg

Claude Code：专注于自动化代码开发

另一个亮点是Claude 3.7推出了Claude Code功能，这一功能专注于全自动化代码开发。Claude Code能够帮助开发者快速理解和定位项目中的代码逻辑，通过自动扫描整个代码库，精准找到相关代码段并解析其功能。这大大提升了开发效率，尤其在调试复杂问题和进行大规模代码重构时，Claude Code的表现尤为突出。

Claude Code的亮眼表现，在早期的测试阶段便已证明其能显著缩短开发时间，通常45分钟以上的手动代码任务，Claude Code能够在短时间内完成，极大降低了开发成本。

392745899BF3BD1F221CDD3865D859E6A48649D5_size34_w1045_h588.jpg

多平台支持与定价策略

Claude 3.7 Sonnet目前已在多个平台上线，包括Anthropic API、亚马逊Bedrock和谷歌云Vertex AI平台。它提供了不同的套餐版本，包括免费版、专业版、团队版和企业版，所有套餐均支持扩展思维模式。根据定价，输入每百万token收费3美元，而输出（包括思考token）每百万token收费15美元。这样的定价政策为用户提供了灵活的选择，同时也确保了其高效性和可扩展性。