自从DeepSeek R1横空出世,整个AI圈瞬间沸腾。有人说它证明了“智能下半场”已然开启,也有人觉得这只是阶段性爆点,谈不上颠覆。OpenAI、Anthropic、Google等第一梯队的反击、算力供应链的震荡、Agent应用的未来……一场AI大变局似乎正蓄势待发。本篇文章将聚焦DeepSeek在新范式下的深远影响,并尝试判断:智能竞赛如何继续上演?下一个“惊喜时刻”又会从哪里出现?
DeepSeek毫无疑问地超越了Meta Llama,但要说它整体领先OpenAI、Anthropic、Google等第一梯队玩家,还为时尚早。比如Google的Gemini 2.0 Flash就在多模态能力和成本上可能比DeepSeek更强。
然而,DeepSeek的核心价值在于它把OpenAI o1“半遮半掩”的RL(强化学习)范式彻底揭开,并用开源方式搅动行业,让更多团队相信:这个新范式是真能提升智能的。
DeepSeek并未真正“发明”新范式,它更多是通过开源把强化学习(RL)与Reasoning Model的路径真正带入大众视野。OpenAI的o1等模型虽然做过类似尝试,但并未彻底公开细节。
DeepSeek的出现,则为业界指明一条更清晰的智能提效路线:RL+Reasoning Model=更强推理、更优解题,让中小团队也能加入这场AI大竞速。
Anthropic CEO Dario曾表示,base model与reasoning model应属于同一连续光谱,不能简单拆分成独立模型链路。也就是说,他们想做的是在基础模型阶段就大量运用RL技巧,大幅提升base model本身,而不仅仅依赖单独的reasoning model。
这种策略也解释了为何Anthropic的Sonnet 3.5在编码、推理等能力上迅速增强,却没见“4o”版本同步爆发——他们可能早在预训练阶段就已“加了料”。
技术上,DeepSeek的开源、极低成本、联网能力以及公开CoT(Chain of Thought)都起了重大作用,但它之所以能在2025年初掀起这么大波澜,也有些“天时地利人和”的成分:
若将AI玩家分为ToC、To Developer和To Enterprise三类:
长远而言,“开源”将对闭源的OpenAI/Anthropic/Google形成一波冲击;但这些大型玩家依然掌握海量GPU与人才资源,更可能在后续研究中再次领跑。算力投入与算法创新,依旧是决定谁能笑到最后的关键。
DeepSeek如何在Pre-Training阶段处理大量蒸馏数据,这点仍是一个谜。如果只是站在第一梯队巨头的肩膀上进行大规模蒸馏,那么其突破很可能并非“原创式惊艳”。
但若DeepSeek从0开始自研模型再通过RL来强化,那就“吓人”了;这意味着他们没有完全依赖外部骨干模型,就在短时间内达到了与顶级闭源模型近似的水准。无论如何,蒸馏本身似乎难以突破SOTA,或许关键在于Reward Model与R1 Zero等新路径的潜力。
Google曾在内部文件中评价OpenAI是“No Moat”(无护城河),但这句话也适用于整个智能竞争。DeepSeek的迅速崛起说明:只要有更智能、更便捷的产品出现,用户就会疯狂“迁移”,对上一代产品毫无忠诚度可言。
在这一轮AI竞赛中,模型本身似乎比任何产品形态、商业模式创新更具杀伤力。智能的“陡峭增长曲线”让现有护城河变得脆弱。
DeepSeek R1走红后,团队显得有些犹豫:要不要继续深耕Chatbot,承接大量用户?
这关乎研究型组织与商业化导向能否兼容,许多ToC公司的逻辑是“先收割用户再优化技术”。但DeepSeek若一头扎进用户运营,可能分散技术研究的精力;若完全放弃,也可能错失做大规模的机会。
**Chatbot只是短期风口还是AI时代的核心入口?**这是DeepSeek需要认真思考的问题。
在这场全球瞩目的“AI竞赛”中,DeepSeek的崛起让人看到中国AI人才的底气与硬实力。技术无国界,但谁能掌握更多资源、做出更多算法创新,就能对智能进程的走向产生更深远的影响。
无论如何,希望AGI探索能在更多国家与团队的积极贡献下,加速前行。
DeepSeek的出现,证明了“短时间内高强度追平”并非不可能,开源思潮与RL范式也随之迎来新的井喷。“技术无护城河”的AI时代正在书写它新的篇章。
真正的“下半场”何时开启?无人能断言。但随着Agent、下一代模型探索及更广泛的算力爆发,我们或许会看到更多意想不到的惊喜与变局。这场激动人心的AI竞赛,还远没有到曲终人散之时。