混乱、分裂与吞并：2024年的硅谷AI之战

2025-01-14 09:13:08 198 大屏时代

2024年，硅谷生成式AI领域继续保持高速发展，但这一年比2023年更加复杂多变。巨头间的技术竞赛、初创公司的起伏、市场对AI未来的分歧以及技术路径的探索，都让这一年的AI大战充满了戏剧性。

这一年，有令人兴奋的技术突破，有巨头的多轮融资，还有初创公司的高调陨落与被收购。本文将带您回顾2024年硅谷生成式AI的关键时刻，并展望2025年可能出现的技术与市场趋势。

一、OpenAI：风波之后的新路线

1. 宫斗落幕：权力的稳定与代价

OpenAI在2024年继续经历了内部动荡。随着首席科学家Ilya Sutskever、超级对齐团队关键人物Jan Leike、CTO Mira Murati等核心人物离职，创始团队的11人仅剩3人。这些人事变动为OpenAI带来了短期的不确定性，但也让CEO Sam Altman获得了更大的权力。

在经历了这场“宫斗”后，OpenAI的战略方向更加明晰：通过商业化与技术升级推进盈利，同时坚持公共利益公司（PBC）的定位。2024年10月，OpenAI完成了新一轮66亿美元的融资，公司估值达到1570亿美元。

2. 技术探索：从大力出奇迹到推理突破

2024年，OpenAI没有如预期发布GPT-5，但通过一系列迭代模型（如o1和o3）展示了新的技术路线——推理能力的强化。特别是o1（内部代号为“Strawberry”）引入了“慢思考”的理念，通过推理链（CoT）算法大幅提升了模型在科学、编码、数学等复杂领域的表现。

年底，OpenAI发布了更为先进的o3模型，其推理能力和科学问题处理能力超越了人类博士生。这种强化推理能力的路线展现了超越传统大规模预训练的可能性，为2025年的AGI发展方向奠定了基础。

二、谷歌：多模态与AI Agent的全面追赶

1. 多模态竞争：Gemini 2.0的发布

谷歌的多模态大模型Gemini 2.0在2024年底发布，进一步增强了文本、音频和视频的理解与生成能力。与OpenAI的4o对比，Gemini 2.0在多模态处理和推理速度上展现出显著优势。

2. AI Agent布局：Project Astra的突破

谷歌继续押注AI Agent，并通过Gemini 2.0支持的“Project Astra”探索了AI助理的新可能性。这个项目结合了谷歌地图、搜索和Lens等工具，为用户提供个性化的实时服务，被认为是智能体（Agent）技术的未来方向之一。

3. 长文本技术：NotebookLM的成功

依托Gemini大模型的长文本能力，谷歌推出了AI笔记管理工具NotebookLM，其音频概览功能成为2024年的爆款应用。通过“AI播客”形式，NotebookLM为用户提供了高度个性化的信息获取方式，这一模式在硅谷引发了广泛关注。

三、初创公司：陨落与新星的崛起

1. 陨落的明星：烧钱与技术壁垒的双重困境

2024年，曾经的明星初创公司Character.ai、Inflection.ai和Adept因资金链断裂而被巨头收购。这些案例表明，在大模型领域，缺乏清晰的商业模式和技术壁垒的初创企业难以长久生存。

2. 新星崛起：Perplexity与Physical Intelligence

与此相对，一些初创公司通过精准的市场定位和高效的资源整合崭露头角：

Perplexity：作为AI搜索引擎的创新者，Perplexity在2024年完成5亿美元融资，估值达到90亿美元。其独特的数据整合能力和用户体验使其成为AI搜索领域的佼佼者。
Physical Intelligence：这家公司致力于为机器人打造“大脑”，其基础模型π0在具身智能领域实现了突破性进展，为AI机器人开发奠定了新基础。