OpenAI 重磅推出「Operator」代理，AI 竞赛加速升级：Perplexity AI、Anthropic 同步发力

2025-01-27 10:18:47 199 大屏时代

在全球人工智能应用加速落地的关键时刻，OpenAI、Perplexity AI 与 Anthropic 三大玩家几乎同日宣布重要升级：OpenAI 全新推出“Operator”代理，以多模态能力与强化学习技术挑战更复杂的日常自动化；Perplexity AI 则把类似功能带到了 Android 应用；而 Anthropic 则针对企业级客户提供了新的“Citations”引用功能，以完善其模型的可溯源能力。这一系列动作预示着 AI 服务竞争正快速升温，未来“可执行任务”型代理或将成为新一轮行业竞跑的焦点。

微信图片_20250127101716.png

01 OpenAI 的重磅新品：Operator 代理

1. 用户可用自然语言“一键指令”完成多步骤任务
OpenAI 宣布推出名为 Operator 的 AI 代理，能够自动在各类网站或应用上帮用户执行任务，例如订购杂货、预订机票或填写表格。用户只需以自然语言输入指令，Operator 即可启动内置浏览器，访问相关网址并通过“输入、点击、滚动”等方式完成操作。这种模式大幅拓宽了 ChatGPT 的应用边界，让 AI 从“内容生成”走向“任务执行”。

2. 新增 CUA 模型：强化学习与 GPT-4 多模态结合
Operator 的底层引擎名为 CUA（全称暂未公开），部分基于 GPT-4 多模态大语言模型，同时融合了“通过强化学习实现的高级推理”能力。也就是说，Operator 不仅能理解文字、图像，还能在执行复杂决策与推理时进行自我纠错和状态跟踪，以完成更具挑战性的操作。

3. 强调隐私安全与数据保护
OpenAI 在 Operator 的设计中加入了多项“数据保护”措施：

人工切换：在涉及登录账号、输入私密信息等敏感操作时，Operator 会要求用户手动接管，以避免不必要的自动化泄露。
定期截屏：在执行任务过程中，Operator 会不断截屏，以确保流程正常进行；同时在任务结束前停止截屏，防止后续数据滥用。
一键注销：用户可随时从所有账号注销，并禁止 OpenAI 将相关数据用于模型训练。
恶意网站识别：系统内置对钓鱼网站、诱导泄露信息的检测能力，提升安全性。

4. 开放路径：从 ChatGPT Pro 到 API
目前，Operator 作为研究预览版在 ChatGPT Pro 高级版中提供。OpenAI 计划未来向更广泛的用户层级开放，并通过 API 让开发者在各类应用场景中植入 Operator。OpenAI 还表示，Operator 后续将会升级以更好地胜任复杂、多步骤的自动化任务。

02 Perplexity AI 强化移动端，推出「Perplexity Assistant」

几乎与 OpenAI 同步，主打“AI 搜索引擎”的 Perplexity AI 在 Android 应用中发布了类似 Operator 的代理功能——Perplexity Assistant。

多模态支持：该功能能够分析手机摄像头画面、屏幕信息，并可在 Spotify、YouTube、Uber 以及邮件、消息、闹钟等应用中执行操作。
自动化场景：例如一键网购、预约打车、快速处理邮件等，不需要用户手动跳转多个APP。
未来扩容：Perplexity AI 透露，将在后续升级中接入更多服务和应用，让移动端“AI 助理”具备更强的生态整合能力。

这意味着 Perplexity AI 不仅在搜索体验上持续创新，也开始向“可执行任务”型代理扩张，与 OpenAI 正面竞争。

03 Anthropic 强化企业级引用：更新「Citations」功能

另一家深耕企业服务的 AI 公司 Anthropic 同日宣布对其 Claude 模型进行升级，为其提供了全新的 “Citations” 功能。

更好可溯源：企业客户可上传文档资料，Claude 在生成回复时会高亮显示引用文档的具体句子或段落，提升回复的可溯源性和可信度。
优化合规：在医疗、金融、政务等场景，准确引用权威或内部资料对于合规和安全都尤为重要。
对话精度：新功能也能帮助用户更快速地定位关键信息，减少误判或“编造”情况的出现。

相对于 OpenAI 的 Operator 和 Perplexity AI 的智能助手，Anthropic 的这次更新更侧重于 B2B 场景，让 Claude 能在企业内部知识管理、文档处理、客户支持等方向发挥更大价值。

04 全面竞争：AI 代理与自动化成新增长引擎

从以上三大玩家的动作来看，AI 行业正进入**“代理+搜索+任务自动化”**的全新竞争阶段。简单来说，AI 已不满足于为用户“提供答案”或“生成文本”，而是开始“替用户行动”，由“信息中介”升级为“智能代理”。

低门槛可用用户只需使用自然语言或少量指令即可驱动代理完成繁琐操作，无需专业编程或脚本。
场景应用广泛从个人生活（购物、旅行、娱乐）到商务办公（文件处理、数据分析、客户管理），AI 代理具备高度灵活性和跨平台兼容能力。
数据与安全挑战随着代理在更多环节中获取用户数据，隐私保护和网络安全的重要性被推至更高层级。各家厂商都在以不同方式加强合规与加密措施。
开发者生态无论是 OpenAI 计划开放 Operator API，还是 Perplexity AI、Anthropic 对第三方接入的支持，皆预示着 AI 代理背后构建的生态系统将成为下一波产业竞争的关键。

05谁能在 AI 代理大战中率先突围？

随着 AI 在自动化执行上的技术加持不断提升，OpenAI、Perplexity AI、Anthropic 等先行者正抢滩这一市场。其中，OpenAI 依托 GPT-4、多模态和强化学习，使 Operator 具备“成熟大语言模型+高阶推理”两大杀手锏；Perplexity AI 继续深耕搜索与移动端入口的结合；Anthropic 则深耕企业级场景，以引用功能等专业化需求寻求差异化竞争。

可以预见的是，“可执行任务”型代理将成为未来 AI 应用的重要发展方向，从搜索、问答进一步跨越到实际行动。谁能在技术、数据安全、生态建设等层面优先抢占先机，或将决定在新一轮 AI 服务大战中的地位和话语权。而对于用户而言，能轻松“指挥 AI”完成多步骤操作的时代，已然近在眼前。

OpenAI推出智能体Operator，AI Agent商业化迎来加速拐点

OpenAI发布新智能体，AI不再只是聊天，而是行动派！

智能体大潮来袭：2025年，AI如何重新定义工作与生活

Opera 推出本地运行人工智能代理助力跨网站智能操作

谷歌 DeepMind 推出新框架 InfAlign：提升语言模型推理对齐能力

上一篇： DeepSeek登顶App Store中国区免费榜，引爆AI新格局：国运级突破，引全球热议

下一篇： Perplexity AI 再提收购 TikTok 方案：美政府或持半数股权，字节跳动留核心演算法

本文地址：https://www.dapingtime.com/article/1109.html