最近,有消息传出,OpenAI 计划推出一款名为“Operator”的人工智能工具,该工具能够控制个人电脑并代表用户执行任务。软件工程师 Tibor Blaho 在社交媒体上透露了这一信息,并表示他发现了关于这款工具的最新线索。此前,包括 Bloomberg 在内的多家媒体曾报道过有关“Operator”的传闻,称其能够自主完成各种任务,如编程和预订旅行。
Blaho 表示,“Operator”计划于 2025 年 1 月发布。他在 ChatGPT macOS 客户端中发现了隐藏选项,允许用户定义切换“Operator”和强制退出“Operator”的快捷方式。此外,“Operator”的相关信息也出现在了 OpenAI 的网站上,但这些信息尚未公开。
Blaho 还提到,在 OpenAI 的网站上有一些表格将“Operator”与其他用于计算机任务的 AI 系统进行了比较。这些表格可能只是占位符。如果表格中的数据准确无误,则表明“Operator”在执行特定任务时并不总是可靠的。
OSWorld 进行的一项基准测试显示,“OpenAI Computer Using Agent (CUA)”的得分为 38.1%,虽然超过了 Anthropic 的计算机控制模型,但仍然远低于人类得分 72.4%。在 WebVoyager 测试中,“Operator”超越了人类的表现;而在 WebArena 测试中,则未能达到人类水平。对于一些简单的任务,如注册云服务提供商和启动虚拟机,“Operator”的成功率仅为 60%;而创建比特币钱包的成功率更是只有 10%。
OpenAI 进入 AI 代理市场之际,Anthropic 和 Google 等竞争对手也在竞相推出类似技术。尽管目前 AI 代理技术仍处于初级阶段,但市场分析公司 Markets and Markets 预测,到 2030 年 AI 代理市场的价值将达到 471 亿美元。
当前的 AI 代理技术虽然基础,但仍有一些专家对其潜在的安全风险表示担忧。Blaho 泄露的数据表明,“Operator”在某些安全评估中表现良好,并能有效应对试图让系统执行“非法活动”或搜索“敏感个人信息”的尝试。安全测试被认为是导致“Operator”开发周期较长的原因之一。
OpenAI 共同创始人 Wojciech Zaremba 在社交媒体上批评 Anthropic 发布的代理缺乏安全措施,并表示如果 OpenAI 发布类似产品可能会引发负面反应。
总结:本文介绍了 OpenAI 计划推出的名为“Operator”的人工智能工具及其功能、当前表现以及相关的安全问题。随着其他竞争对手也在竞相推出类似技术,OpenAI 面临着激烈的市场竞争和技术挑战。要点:
- 即将到来的 OpenAI “Operator”工具能够自主控制电脑执行编程和预订旅行等任务。
- 根据泄露的信息,“Operator”在某些任务上的成功率较低,并且表现不如人类。
- 尽管“Operator”在安全评估中表现出色,但专家对其潜在的安全风险仍表示担忧。