AI圈的“诸神之战”正在上演!DeepSeek开源周第二日再投“技术核弹”,阿里通义千问、Anthropic Claude 3.7 Sonnet紧急加入推理模型战场,一场围绕开源生态、算力优化与代码能力的全球AI竞赛彻底白热化。
继首日发布FlashMLA(专为英伟达H100/H800显卡设计的极致优化工具)后,DeepSeek今日开源DeepEP通信库,直击MoE(专家混合)模型并行训练中的通信效率痛点。官方称,该库能让专家模块的数据交换速度提升30%,国内多家AI公司已连夜测试适配。
评论区开发者疯狂刷屏:“这才是真Open!”“OpenAI学着点!”甚至有网友喊话奥特曼:“闭源路线已过时!”此前DeepSeek开源模型R1已吸引大量政府、高校及企业接入,其生态扩张速度让闭源阵营压力陡增。
阿里今日推出基于Qwen2.5-Max的QwQ-Max-Preview推理模型,主打思维链可视化和联网搜索能力。实测中,面对一道数学竞赛题,QwQ耗时122秒给出正确答案,虽略慢于DeepSeek R1(112秒),但展示完整推理路径。网友调侃:“名字可爱,实力能打!”
凌晨2点,Anthropic放出Claude 3.7 Sonnet,号称“迄今最聪明模型”,融合传统模型与推理架构。实测显示,其代码生成速度与准确性碾压同行:同一需求下,Claude 3.7代码质量完胜Grok 3,甚至将DeepSeek R1甩开身位。但用户若想查看“思考过程”,需付费开启扩展模式,被吐槽“推理能力也要氪金”。
业内人士预测,今年或成AI行业分水岭:“开源将吃掉80%的行业蛋糕,闭源玩家只剩高端定制市场可守。”
▶ 这场AI竞赛没有终点——但可以肯定,谁不开源,谁先出局。
阅读完之后,您还可以阅读
Claude 3.7 Sonnet发布:双思维模式提升推理能力,挑战DeepSeek与o3
Claude 3.7 Sonnet发布:全球首个混合推理模型带来AI思考革命
微软砍租约VS阿里砸3800亿:全球算力大战背后的战略大转弯
月之暗面Kimi联合清华大学等开源共建大模型推理架构Mooncake
腾讯发布混元视频生成大模型:130亿参数全面开源,推动AI创意内容生成
OpenAI宣布未来3周举行12场新品发布会 我们能期待些什么?
The Thought Emporium发布基于射电望远镜技术的3D打印“Wi-Fi相机”
阿里通义千问发布开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
蚂蚁集团发布2024科技生态白皮书:AI专利取得显著突破,推动全球科技发展
Rust编程语言水逆:从开发热潮到被弃用,真实体验背后的反思
国产AI之光:杭州DeepSeek公司挑战全球巨头,成为AI大模型革新先锋
微软开源Phi-4:超强小参数模型震撼登场,超越GPT-4o,商用无门槛
Firefox危矣?Linux基金会、谷歌、微软、Meta等联合成立Chromium联盟
Databricks为何能刷新硅谷融资纪录?解密AI“卖铲人”崛起之道
深度学习的引擎:飞桨(PaddlePaddle)如何驱动产业AI变革