Press ESC to close

OpenAI 推出 Operator,这是一个能够独立完成任务的人工智能助手

openAI-spiral-color-v2.jpg?w=650

OpenAI 的 CEO Sam Altman 在年初的一篇博文中表示,2025 年将是 AI 代理的转折点,这些代理可以自动化任务并代表你执行操作。

现在,我们看到了 OpenAI 的首个实际尝试。

OpenAI 在周四宣布,它将推出一个名为 Operator 的通用 AI 代理的研究预览版。这个代理可以控制网页浏览器并独立执行某些操作。首先,Operator 将在美国用户的 ChatGPT Pro 订阅计划中推出,OpenAI 计划在未来将其推广到 Plus、Team 和 Enterprise 等更多用户群体。

“[Operator] 将很快出现在其他国家和地区,”Sam Altman 在周四的直播中表示,“欧洲的情况则需要更长的时间。”

这次初步的研究预览可以通过 operator.chatgpt.com 访问,但 OpenAI 表示,他们希望将 Operator 集成到所有 ChatGPT 客户端中。

Operator的首页界面

Operator 承诺可以自动化诸如预订旅行住宿、预约餐厅和在线购物等任务。用户可以在 Operator 的界面上选择不同的任务类别,包括购物、配送、餐饮和旅行等。

当 ChatGPT 用户激活 Operator 时,会出现一个小窗口显示代理使用的专用网页浏览器以及它正在执行的具体操作。用户在 Operator 工作时仍然可以控制屏幕,因为 Operator 使用的是自己的专用浏览器。

OpenAI 表示,Operator 是由一种结合了 GPT-4o 模型视觉能力和 OpenAI 更高级模型推理能力的计算机使用代理模型(CUA)驱动的。CUA 受训于与网站前端交互的能力,这意味着它不需要使用面向开发者的 API 来访问不同的服务。

换句话说,CUA 可以像人类一样点击按钮、导航菜单和填写表单。

OpenAI 正在与 DoorDash、eBay、Instacart、Priceline、StubHub 和 Uber 等公司合作,确保 Operator 遵守这些企业的服务条款。

相关图片

“CUA 模型在执行外部副作用任务之前会要求用户确认,例如提交订单或发送电子邮件等,以便用户在工作成为永久性之前进行检查。”OpenAI 在提供给 TechCrunch 的材料中写道,“它已经在多种情况下证明了其有用性,并且我们希望将其可靠性扩展到更广泛的任务范围。”

不过 OpenAI 警告说 CUA 并不完美。“目前 Operator 无法可靠地处理许多复杂或专门的任务。”OpenAI 在支持文档中补充道,“例如创建详细的幻灯片演示文稿、管理复杂的日历系统或与高度定制或非标准的网页界面交互。”

出于谨慎考虑,对于一些任务如银行交易等,OpenAI 要求监督。例如,在输入信用卡信息时需要用户接手操作。OpenAI 表示 Operator 不会收集或截图任何数据。

“对于特别敏感的网站如电子邮件网站,在这些网站上 Operator 需要用户的主动监督以确保用户可以直接发现并纠正模型可能犯下的任何错误。”OpenAI 在支持材料中写道。

局限性

Operator 有几个值得注意的局限性。

存在每日和任务相关的速率限制。虽然 Operator 可以同时执行多个任务,但存在动态限制。总体使用限制也会每天重置。

在当前版本中,出于安全原因 Operator 会拒绝执行某些任务,例如发送电子邮件(尽管 CUA 能够执行此操作)和删除日历事件。未来可能会改变这一情况,但没有给出具体时间表。

如果遇到特别复杂的界面、密码字段或验证码检查时,Operator 可能会“卡住”。在这种情况下它会要求用户接手操作。

Agenic 未来

与其他竞争对手相比(如 Rabbit、Google 和 Anthropic),OpenAI 在开发 AI 代理方面进展较慢。这可能与这项技术的安全风险有关。

当 AI 系统可以在网络上采取行动时,就会打开更多危险的应用场景的大门。例如自动化 AI 代理来策划网络钓鱼攻击或 DDoS 攻击,在别人之前抢购演唱会门票等。尤其是对于像 ChatGPT 这样广泛使用的工具来说,在防止这些类型的攻击方面采取措施非常重要。

Agenic 未来

Agenic 未来

总结:本文介绍了 OpenAI 推出的名为 Operator 的通用 AI 代理的研究预览版。该代理能够控制网页浏览器并独立执行某些操作,并将首先在美国用户的 ChatGPT Pro 订阅计划中推出。虽然目前存在一些局限性和安全问题需要解决,但这一举措标志着 OpenAI 在 AI 代理领域的进一步探索和发展。
Fritz Gaylord

Hi, I’m Fritz Gaylord, Your Blogging Journey Guide 🖋️. Writing, one blog post at a time, to inspire, inform, and ignite your curiosity. Join me as we explore the world through words and embark on a limitless adventure of knowledge and creativity. Let’s bring your thoughts to life on these digital pages. 🌟 #BloggingAdventures

Leave a comment

Your email address will not be published. Required fields are marked *

@Katen on Instagram