——全球首个双轨并行优化方案开源,大模型训练成本或降40%
北京时间今日午间,国内AI独角兽深度求索(DeepSeek)在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术,直击千亿参数大模型训练的算力瓶颈,GitHub首发5小时即登热榜首位,开发者社区惊呼“分布式训练的Game Changer来了”。
1. DualPipe:让GPU“喘口气”的时空魔术
2. EPLB:AI世界的“智能交通指挥官”
据第三方测算,组合使用两项技术可使千亿参数模型的单次训练成本下降38%-42%。某自动驾驶公司CTO向快科技透露:“原本需要2000张H100的训练任务,现在1200张卡就能完成,仅硬件投入就省下2.4亿元。”
这背后是残酷的商业现实:2024年全球AI训练算力支出突破820亿美元,但超35%资源浪费在通信等待与负载不均。DeepSeek技术负责人坦言:“我们开源的不仅是代码,更是重新定义算力价值的标尺。”
GitHub数据显示,DualPipe仓库发布3小时即获544星,EPLB被fork超200次。著名开源社区LF AI基金会评价称:“这是首个同时优化计算流与资源调度的完整方案,堪比AI界的Kubernetes。”
值得关注的是,DeepSeek此次未像惯例采用Apache协议,而是选择更开放的MIT许可证。分析人士指出,这与其正在构建的“AI算力联盟”战略密切相关——通过降低生态伙伴的合规成本,加速技术标准的普及。
未来已来:当谷歌、Meta还在为TPU集群的封闭生态鏖战时,DeepSeek正用开源利剑劈开新赛道。据知情人士透露,已有三家云厂商计划基于DualPipe+EPLB打造新一代AI训练云服务。这场由中国人主导的算力效率革命,或将重塑全球AI基础设施的权力版图。
阅读完之后,您还可以阅读
月之暗面Kimi联合清华大学等开源共建大模型推理架构Mooncake
腾讯发布混元视频生成大模型:130亿参数全面开源,推动AI创意内容生成
OpenAI宣布未来3周举行12场新品发布会 我们能期待些什么?
The Thought Emporium发布基于射电望远镜技术的3D打印“Wi-Fi相机”
阿里通义千问发布开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
蚂蚁集团发布2024科技生态白皮书:AI专利取得显著突破,推动全球科技发展
Rust编程语言水逆:从开发热潮到被弃用,真实体验背后的反思
国产AI之光:杭州DeepSeek公司挑战全球巨头,成为AI大模型革新先锋
微软开源Phi-4:超强小参数模型震撼登场,超越GPT-4o,商用无门槛
Firefox危矣?Linux基金会、谷歌、微软、Meta等联合成立Chromium联盟
Databricks为何能刷新硅谷融资纪录?解密AI“卖铲人”崛起之道
深度学习的引擎:飞桨(PaddlePaddle)如何驱动产业AI变革
扎克伯格独家访谈:从苹果税争议到AI护栏,科技变革如何重塑世界?
开源推理AI模型Sky-T1-32B:训练成本仅450美元的全新突破
Sky-T1:开源推理型AI模型,450美元训练成本开启新纪元