在全球人工智能应用加速落地的关键时刻,OpenAI、Perplexity AI 与 Anthropic 三大玩家几乎同日宣布重要升级:OpenAI 全新推出“Operator”代理,以多模态能力与强化学习技术挑战更复杂的日常自动化;Perplexity AI 则把类似功能带到了 Android 应用;而 Anthropic 则针对企业级客户提供了新的“Citations”引用功能,以完善其模型的可溯源能力。这一系列动作预示着 AI 服务竞争正快速升温,未来“可执行任务”型代理或将成为新一轮行业竞跑的焦点。
1. 用户可用自然语言“一键指令”完成多步骤任务
OpenAI 宣布推出名为 Operator 的 AI 代理,能够自动在各类网站或应用上帮用户执行任务,例如订购杂货、预订机票或填写表格。用户只需以自然语言输入指令,Operator 即可启动内置浏览器,访问相关网址并通过“输入、点击、滚动”等方式完成操作。这种模式大幅拓宽了 ChatGPT 的应用边界,让 AI 从“内容生成”走向“任务执行”。
2. 新增 CUA 模型:强化学习与 GPT-4 多模态结合
Operator 的底层引擎名为 CUA(全称暂未公开),部分基于 GPT-4 多模态大语言模型,同时融合了“通过强化学习实现的高级推理”能力。也就是说,Operator 不仅能理解文字、图像,还能在执行复杂决策与推理时进行自我纠错和状态跟踪,以完成更具挑战性的操作。
3. 强调隐私安全与数据保护
OpenAI 在 Operator 的设计中加入了多项“数据保护”措施:
4. 开放路径:从 ChatGPT Pro 到 API
目前,Operator 作为研究预览版在 ChatGPT Pro 高级版中提供。OpenAI 计划未来向更广泛的用户层级开放,并通过 API 让开发者在各类应用场景中植入 Operator。OpenAI 还表示,Operator 后续将会升级以更好地胜任复杂、多步骤的自动化任务。
几乎与 OpenAI 同步,主打“AI 搜索引擎”的 Perplexity AI 在 Android 应用中发布了类似 Operator 的代理功能——Perplexity Assistant。
这意味着 Perplexity AI 不仅在搜索体验上持续创新,也开始向“可执行任务”型代理扩张,与 OpenAI 正面竞争。
另一家深耕企业服务的 AI 公司 Anthropic 同日宣布对其 Claude 模型进行升级,为其提供了全新的 “Citations” 功能。
相对于 OpenAI 的 Operator 和 Perplexity AI 的智能助手,Anthropic 的这次更新更侧重于 B2B 场景,让 Claude 能在企业内部知识管理、文档处理、客户支持等方向发挥更大价值。
从以上三大玩家的动作来看,AI 行业正进入**“代理+搜索+任务自动化”**的全新竞争阶段。简单来说,AI 已不满足于为用户“提供答案”或“生成文本”,而是开始“替用户行动”,由“信息中介”升级为“智能代理”。
随着 AI 在自动化执行上的技术加持不断提升,OpenAI、Perplexity AI、Anthropic 等先行者正抢滩这一市场。其中,OpenAI 依托 GPT-4、多模态和强化学习,使 Operator 具备“成熟大语言模型+高阶推理”两大杀手锏;Perplexity AI 继续深耕搜索与移动端入口的结合;Anthropic 则深耕企业级场景,以引用功能等专业化需求寻求差异化竞争。
可以预见的是,“可执行任务”型代理将成为未来 AI 应用的重要发展方向,从搜索、问答进一步跨越到实际行动。谁能在技术、数据安全、生态建设等层面优先抢占先机,或将决定在新一轮 AI 服务大战中的地位和话语权。而对于用户而言,能轻松“指挥 AI”完成多步骤操作的时代,已然近在眼前。
相关标签: AI Operator OpenAI Perplexity 代理 Anthropic 用户 应用 任务 模态