谷歌推出能独立使用网站的AI代理

今天，聊天机器人可以回答问题、写诗和生成图像。

未来，它们还可能自主执行任务，如在线购物，并与电子表格等工具合作。

谷歌在周三发布了一款此类技术的原型，研究人员称之为AI代理。

谷歌是众多正在开发AI代理的科技公司之一。

包括OpenAI和Anthropic在内的各种AI初创公司也发布了类似原型，这些原型能够使用软件应用程序、网站和其他在线工具。

谷歌的新原型名为Mariner，基于Gemini 2.0，该公司也在同一天发布了Gemini。

Gemini是支撑谷歌众多AI产品和研究实验的核心技术。

该系统的版本将为同名聊天机器人和Google搜索工具AI Overviews提供动力，后者可以直接回答用户的问题。

谷歌项目经理Jaclyn Konzelmann在接受《纽约时报》采访时说：“我们基本上允许用户在浏览器中输入请求，并由Mariner代为执行操作。

”

Gemini是一种神经网络——一种通过分析大量数据来学习技能的数学系统。

例如，通过识别互联网上文章和书籍中的模式，神经网络可以学会自己生成文本。

最新的Gemini版本从文本、图像和声音等多种数据中学习。

Mariner可以根据Gemini学到的知识使用类似的在线服务。

它可以理解需要点击按钮才能触发某些操作，并且可以在现实世界中采取行动。

Konzelmann表示，Mariner是设计成与人类协同工作的。

例如，在用户处于活动浏览器标签页时，它可以将虚拟购物车填满杂货，但不会实际购买这些杂货。

用户仍需完成购买。

谷歌CEO Sundar Pichai在一篇博文中表示，这些进展使我们更接近于实现通用助手的愿景。

该项目作为Google流行的网络浏览器Chrome的扩展开发而成，成为公司未来AI雄心的重要平台。

然而，这些计划可能会面临挫折。

司法部已要求联邦法官强制谷歌出售或剥离Chrome浏览器，在一项具有里程碑意义的判决后认定谷歌搜索引擎构成非法垄断。

还有其他挑战。

Konzelmann承认与其他聊天机器人一样，Mariner也会犯错。

由于这些系统根据大量数据中的模式运行，在某些情况下会出现偏差。

当聊天机器人生成文本时出现的错误有时不易察觉，但在系统尝试使用网站并采取其他行动时，则更为严重。

Konzelmann说：“它还不总是准确的。

”这仍然是一项实验性技术。

目前，谷歌仅与公司外部的一小部分测试者分享了Mariner，并未公布更广泛的发布计划。

在周三的展示中，该公司还展示了Project Astra的新版本——一种智能手机数字助手。

它可以响应图像、文本以及口头命令。

Astra是比苹果Siri更强大的数字助手版本，并且目前尚未向公众开放使用。