首页 > 3D快报内容详情

清北应届生撑起DeepSeek天:年轻团队背后的中国版OpenAI

1天前 11 大屏时代

DeepSeek-v3横空出世,震撼AI圈
1/11算力 超越 Llama3 的开源大模型 DeepSeek-v3 引爆了AI领域的关注。而随着这一技术突破的公开,团队的年轻化背景成为外界热议的焦点——一个由清华、北大的应届毕业生撑起的团队如何走向行业前沿?

2025010510213276740.jpg

DeepSeek团队:年轻化与高创新的结合

DeepSeek团队最大的亮点在于 年轻化。核心技术岗位大多由博士在读生或应届毕业生担任,这些来自清华、北大、北邮的年轻人通过在大模型架构、算法创新和软硬件协同优化等领域的卓越贡献,迅速推动DeepSeek从默默无闻到行业顶尖。

2025010510213276776.jpg

1. 革命性算法创新:MLA与GRPO

  • MLA(Multi-head Latent Attention)MLA架构用全新注意力机制替代了传统多头注意力,大幅降低了计算量与显存需求。这一创新由 北大物理系的高华佐 和 北邮的曾旺丁 主导,为DeepSeek-V2的突破奠定了基础。
  • GRPO(Group Relative Policy Optimization)GRPO作为一种强化学习算法,放弃了传统critic模型,用群体得分估算baseline,大幅减少了资源消耗。清华博士生邵智宏 和团队在DeepSeek-Math中首次实现了这一算法,不仅提升了效率,还被多家顶尖模型(如阿里Qwen2.5)采纳。

2. 实习生的重要角色

DeepSeek的开放环境使得实习生也能完成重要贡献。例如:

  • 邵智宏 参与了DeepSeek-Math、DeepSeek-Prover等多个项目,为强化学习和自然语言处理注入新活力。
  • 北大博士朱琪豪 开发了DeepSeek-Coder-V1,奠定了代码生成领域的技术基础。
  • 清华博士孙景翔 主导了DeepSeek在3D生成领域的首次探索。

20250105102132767912.jpg

硬件优化:软硬件协同的成功典范

DeepSeek不仅在算法创新上引领潮流,还通过硬件协同设计创造了奇迹。

  • Fire-Flyer AI-HPC
    这一软硬件协同架构显著降低了训练成本,以更低能耗实现了对英伟达官方设备的性能超越,助力DeepSeek-v3以最低算力实现突破。

团队中许多核心成员来自英伟达、阿里云等背景深厚的技术团队,负责从DeepSeek LLM v1到v3的硬件优化工作。

创始人梁文锋:用年轻力量驱动创新

DeepSeek创始人梁文锋的用人哲学与创新理念,深刻影响了团队文化。他在接受采访时提到:

“看能力,而不是看经验。”

DeepSeek不仅重用应届毕业生,还给予他们自由探索的机会。任何人都可以调用资源开展项目,当一个想法展现潜力时,公司会自上而下地调配资源。这种 自然分工与资源自由调动 的模式,与OpenAI的组织形态极为相似。

DeepSeek:未来可期的中国版OpenAI

DeepSeek不仅是算法和硬件上的创新者,更是中国AI领域组织模式的引领者。年轻团队的强大执行力与开放的科研氛围,让它被业内誉为中国最像 OpenAI 的公司。未来,DeepSeek不仅可能在大模型领域持续突破,还可能成为全球AI竞争中一颗耀眼的明星。

随着DeepSeek-v3的成功,这支年轻团队也向世界证明,创新无关资历,实力就是最好的名片。

相关标签: DeepSeek 团队 算法 DeepSeekV3 AI 创新 清华 模型 硬件 领域