埃隆·马斯克(Elon Musk)日前透露,其人工智能公司 xAI 正在大幅扩展超级计算机 Colossus 的规模,计划采购多达 100 万个 GPU。这一举措将使 xAI 的 AI 计算能力迈上全新台阶,进一步与谷歌、OpenAI 等竞争对手展开角逐。
目前,xAI 的 Colossus 超级计算机已拥有约 10 万个 GPU,但马斯克的目标是将这一数字提升至 100 万个。根据知情人士透露,扩展项目的核心合作伙伴包括英伟达、戴尔和美超微。英伟达将为 xAI 提供其最新一代的 AI 加速器 GPU,而戴尔和美超微则负责硬件基础设施的集成。
此次扩建将在田纳西州孟菲斯市进行,当地商会已成立“xAI 特别行动团队”,为这一超级项目提供全方位支持。
扩展 Colossus 超算集群将耗资数百亿美元,不仅包括 GPU 的采购,还涵盖服务器建设、供电系统升级和冷却设备改造等内容。今年以来,xAI 已筹集超过 110 亿美元资金,但这一数字距离项目需求仍有一定差距。
马斯克表示:“我们正在全球范围内吸引投资者,以确保这一计划的顺利实施。AI 的未来依赖于强大的计算能力,我们必须尽早布局。”
英伟达在此次项目中扮演了至关重要的角色。xAI 此前已向英伟达订购了价值 10.8 亿美元的 GB200 AI 服务器,并获得了优先交付权。根据协议,英伟达将在 2025 年初开始批量交付这批高性能 GPU。
行业分析人士指出,xAI 的大规模订单可能进一步加剧全球 GPU 市场的紧张局面。随着人工智能技术需求的持续增长,英伟达等供应商的生产能力正在面临严峻考验。
马斯克此举被认为是全球 AI 基础设施竞赛的重要一步。随着 ChatGPT、Google Bard 等生成式 AI 产品的普及,科技巨头纷纷增加在计算能力上的投入,以抢占市场先机。例如,OpenAI 已经启用了新一代超算集群,而谷歌也在持续扩展其 TPU(张量处理单元)的部署规模。
“AI 的竞争已经不仅仅是算法的对抗,更是基础设施的较量,”一位行业专家评论道。“谁掌握了更强大的计算资源,谁就能在未来的 AI 应用场景中占据主导地位。”
通过此次扩展,xAI 将大幅增强其在 AI 模型训练和推理方面的能力,为下一代 AI 应用奠定坚实基础。马斯克还透露,xAI 正在研发一款全新生成式 AI 平台,旨在提供更高效、更具人性化的智能交互体验。
虽然项目前景光明,但巨额资金投入和技术实施的复杂性也为 xAI 带来了不小的挑战。能否按时完成 Colossus 的扩展目标,将成为衡量 xAI 能力的重要指标。
记者点评
马斯克的大手笔再次将全球目光吸引到了 AI 基础设施竞赛中。100 万 GPU 的计划不仅体现了其对 AI 未来的雄心,也标志着科技公司竞争进入了一个新阶段。随着 AI 计算能力的持续提升,我们有理由期待更加智能和高效的技术革命。