Press ESC to close

OpenAI 发布了“操作员”智能助手,专门处理网页任务

openai-logo.jpg

周四,OpenAI 推出了一个名为 Operator 的人工智能程序,它可以处理在线任务,比如订购商品或填写表格。根据 OpenAI 的介绍,Operator 可以查看网页,并通过点击、滚动或输入等方式与网页互动,就像人一样。

OpenAI 表示,Operator 可以处理各种重复的浏览器任务,例如填写表格、订购杂货,甚至创建表情包。这种能力让 AI 能够使用人类日常使用的界面和工具,从而拓宽了 AI 的用途。这不仅帮助人们节省完成日常任务的时间,还为商家提供了新的互动机会。

作为一种最新的 AI 代理,它是一种数字助手,能够感知环境、做出决策并采取行动以实现特定目标。Google 在去年 12 月宣布了 Gemini 2.0 的推出,这是其最先进的 AI 模型。两个月前,Anthropic 将计算机使用功能添加到了其 Claude 前沿 AI 模型中,并在实验性的公测阶段进行了发布。

Anthropic 表示,开发者可以指示 Claude 使用计算机的方式进行操作——通过查看屏幕、移动光标、点击按钮和输入文本。同时他们也提醒这仍处于开发阶段。

OpenAI 将 Operator 描述为一种能够独立完成任务的 AI 代理之一。它仅向付费购买 Pro 订阅的美国用户提供服务,并确保安全和逐步推广。如果 Operator 遇到困难或犯错,它可以利用自身的推理能力进行自我纠正。当它卡住需要帮助时,则会将控制权交还给用户。

根据 OpenAI 的说法,Operator 被训练成在需要登录、提供支付详情或解决在线 CAPTCHA 安全挑战时向用户求助。

用户可以通过创建新的对话来同时执行多个任务。例如,在 Etsy 上订购个性化珐琅杯的同时,在 Hipcamp 上预订露营地。

总结:本文介绍了 OpenAI 推出的名为 Operator 的人工智能程序及其功能特点。Operator 可以处理各种在线任务,并能够独立完成分配给它的任务。此外,文章还提到了 Google 和 Anthropic 在 AI 领域的最新进展,并强调了这些技术如何帮助人们更高效地完成日常任务。
Enos Harvey

Hi, I’m Enos Harvey, Your Blogging Journey Guide 🖋️. Writing, one blog post at a time, to inspire, inform, and ignite your curiosity. Join me as we explore the world through words and embark on a limitless adventure of knowledge and creativity. Let’s bring your thoughts to life on these digital pages. 🌟 #BloggingAdventures

Leave a comment

Your email address will not be published. Required fields are marked *

@Katen on Instagram