生成式人工智能正在以前所未有的速度重塑各行业格局,每天都有新的应用场景和技术突破涌现。在这一蓬勃发展的领域,长期以来美国的科技巨头如OpenAI、Anthropic和Meta占据了主导地位。然而,2025年,一个来自中国的AI初创公司——DeepSeek,凭借其最新发布的DeepSeek-V3模型,打破了这一格局。DeepSeek-V3不仅在性能上超越了诸如OpenAI的GPT-4o和Anthro...
——全球首个双轨并行优化方案开源,大模型训练成本或降40%北京时间今日午间,国内AI独角兽深度求索(DeepSeek)在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术,直击千亿参数大模型训练的算力瓶颈,GitHub首发5小时即登热榜首位,开发者社区惊呼“分布式训练的Game Changer来了...
全新架构与关键技术加持。 摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了 原生 FP8(8位浮点)计算能力,并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破,摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如,在 FlashMLA(高效多头潜在注意力推理内核)中,摩尔线程...