DualPipe

DeepSeek-V3：从创新到领先，中国AI初创公司如何重塑生成式AI格局

生成式人工智能正在以前所未有的速度重塑各行业格局，每天都有新的应用场景和技术突破涌现。在这一蓬勃发展的领域，长期以来美国的科技巨头如OpenAI、Anthropic和Meta占据了主导地位。然而，2025年，一个来自中国的AI初创公司——DeepSeek，凭借其最新发布的DeepSeek-V3模型，打破了这一格局。DeepSeek-V3不仅在性能上超越了诸如OpenAI的GPT-4o和Anthro...

DeepSeek开源“双响炮”：DualPipe算法破局训练效率，EPLB重构AI算力分配

——全球首个双轨并行优化方案开源，大模型训练成本或降40%北京时间今日午间，国内AI独角兽深度求索（DeepSeek）在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术，直击千亿参数大模型训练的算力瓶颈，GitHub首发5小时即登热榜首位，开发者社区惊呼“分布式训练的Game Changer来了...

技术分析：摩尔线程如何支持 DeepSeek “全家桶”

全新架构与关键技术加持。摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了原生 FP8（8位浮点）计算能力，并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破，摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如，在 FlashMLA（高效多头潜在注意力推理内核）中，摩尔线程...

首页 1 尾页