AI圈的“诸神之战”正在上演!DeepSeek开源周第二日再投“技术核弹”,阿里通义千问、Anthropic Claude 3.7 Sonnet紧急加入推理模型战场,一场围绕开源生态、算力优化与代码能力的全球AI竞赛彻底白热化。
继首日发布FlashMLA(专为英伟达H100/H800显卡设计的极致优化工具)后,DeepSeek今日开源DeepEP通信库,直击MoE(专家混合)模型并行训练中的通信效率痛点。官方称,该库能让专家模块的数据交换速度提升30%,国内多家AI公司已连夜测试适配。
评论区开发者疯狂刷屏:“这才是真Open!”“OpenAI学着点!”甚至有网友喊话奥特曼:“闭源路线已过时!”此前DeepSeek开源模型R1已吸引大量政府、高校及企业接入,其生态扩张速度让闭源阵营压力陡增。
阿里今日推出基于Qwen2.5-Max的QwQ-Max-Preview推理模型,主打思维链可视化和联网搜索能力。实测中,面对一道数学竞赛题,QwQ耗时122秒给出正确答案,虽略慢于DeepSeek R1(112秒),但展示完整推理路径。网友调侃:“名字可爱,实力能打!”
凌晨2点,Anthropic放出Claude 3.7 Sonnet,号称“迄今最聪明模型”,融合传统模型与推理架构。实测显示,其代码生成速度与准确性碾压同行:同一需求下,Claude 3.7代码质量完胜Grok 3,甚至将DeepSeek R1甩开身位。但用户若想查看“思考过程”,需付费开启扩展模式,被吐槽“推理能力也要氪金”。
业内人士预测,今年或成AI行业分水岭:“开源将吃掉80%的行业蛋糕,闭源玩家只剩高端定制市场可守。”
▶ 这场AI竞赛没有终点——但可以肯定,谁不开源,谁先出局。
相关文章
Claude 3.7 Sonnet发布:双思维模式提升推理能力,挑战DeepSeek与o3
Claude 3.7 Sonnet发布:全球首个混合推理模型带来AI思考革命
微软砍租约VS阿里砸3800亿:全球算力大战背后的战略大转弯
DeepSeek新模型挑战编程极限,2025年编程只剩Tab键?
DeepSeek-R1震撼登场,AI推理能力和性价比全面超越OpenAI!