推理模型混战！DeepSeek开源周‘炸库’碾压H100，Claude 3.7代码能力屠榜

2025-02-26 07:43:35 1097 大屏时代

AI圈的“诸神之战”正在上演！DeepSeek开源周第二日再投“技术核弹”，阿里通义千问、Anthropic Claude 3.7 Sonnet紧急加入推理模型战场，一场围绕开源生态、算力优化与代码能力的全球AI竞赛彻底白热化。

10E00E60FC33841E386BC29D8FAF3368417B0D38_size107_w1080_h1636.jpg

DeepSeek：开源周“五天五连炸”，GPU性能榨到一滴不剩

继首日发布FlashMLA（专为英伟达H100/H800显卡设计的极致优化工具）后，DeepSeek今日开源DeepEP通信库，直击MoE（专家混合）模型并行训练中的通信效率痛点。官方称，该库能让专家模块的数据交换速度提升30%，国内多家AI公司已连夜测试适配。

评论区开发者疯狂刷屏：“这才是真Open！”“OpenAI学着点！”甚至有网友喊话奥特曼：“闭源路线已过时！”此前DeepSeek开源模型R1已吸引大量政府、高校及企业接入，其生态扩张速度让闭源阵营压力陡增。

773D963D11565095A32382D3865642FA3FD77482_size119_w1080_h1322.jpg

阿里通义千问：首个国产推理模型QwQ-Max上线，数学题苦战两分钟

阿里今日推出基于Qwen2.5-Max的QwQ-Max-Preview推理模型，主打思维链可视化和联网搜索能力。实测中，面对一道数学竞赛题，QwQ耗时122秒给出正确答案，虽略慢于DeepSeek R1（112秒），但展示完整推理路径。网友调侃：“名字可爱，实力能打！”

CF672EA15EC08E045ACE903D34048CFF2E4CEEA9_size164_w694_h471.jpg

Anthropic深夜突袭：Claude 3.7 Sonnet代码屠榜，Grok 3被秒成渣

凌晨2点，Anthropic放出Claude 3.7 Sonnet，号称“迄今最聪明模型”，融合传统模型与推理架构。实测显示，其代码生成速度与准确性碾压同行：同一需求下，Claude 3.7代码质量完胜Grok 3，甚至将DeepSeek R1甩开身位。但用户若想查看“思考过程”，需付费开启扩展模式，被吐槽“推理能力也要氪金”。