谷歌推出能独立使用网站的AI代理

今天，聊天机器人能够回答问题、写诗和生成图像。

未来，它们还可能自主完成像在线购物这样的任务，并与电子表格等工具协作。

谷歌在周三推出了一种这种技术的原型，人工智能研究人员称之为AI代理。

谷歌是众多正在开发AI代理的科技公司之一。

包括OpenAI和Anthropic在内的多家人工智能初创公司也推出了类似的原型，这些原型能够使用软件应用程序、网站和其他在线工具。

谷歌的新原型名为Mariner，基于Gemini 2.0，这也是谷歌在同一天推出的最新技术。

Gemini是支撑谷歌许多AI产品和研究实验的核心技术。

Gemini版本将为同名聊天机器人和Google搜索工具“AI概览”提供动力，“AI概览”能够直接回答用户的问题。

谷歌项目经理Jaclyn Konzelmann在接受《纽约时报》采访时说：“我们基本上允许用户在浏览器中输入请求，让Mariner代表他们采取行动。

”

Gemini是一种神经网络——一种可以通过分析大量数据来学习技能的数学系统。

例如，通过识别互联网上文章和书籍中的模式，神经网络可以学会自行生成文本。

最新的Gemini版本可以从文本、图像和声音等多种数据中学习。

通过借鉴Gemini所学的知识，Mariner可以代表计算机用户使用类似的服务。

它可以理解需要点击某个按钮才能使事情发生，并且可以在现实世界中采取行动。

Konzelmann在接受《纽约时报》采访时说：“Mariner是设计成与人类协同工作的。

”例如，如果用户在浏览器标签页中处于活跃状态，它可以帮助用户将杂货添加到虚拟购物车中，但不会实际购买这些商品。

用户仍需完成购买。

谷歌CEO Sundar Pichai在博客中表示，这些进展将使我们更接近于实现一个通用助手的梦想。

该项目作为Google流行浏览器Chrome的扩展开发而成，成为公司未来AI野心的重要平台。

然而这些计划可能会面临挫折。

美国司法部要求一名联邦法官迫使谷歌出售或剥离Chrome浏览器，在一项具有里程碑意义的裁决后认定其搜索引擎构成非法垄断。

Konzelmann承认，与其他聊天机器人一样，Mariner也会犯错。

因为这些系统根据大量数据中的模式运行，在某些情况下会出错。

当聊天机器人生成文本时出现的错误有时不易察觉，但在系统尝试使用网站并采取其他行动时则更为严重。

Konzelmann说：“它还不总是准确的。

”她表示这仍是一项实验性技术。

目前谷歌仅向公司外部的小部分测试者分享了Mariner，并未公布广泛的发布计划。

在周三的活动中，谷歌还展示了Project Astra的新版本——一款智能手机数字助手。

Astra能够响应图像、文本以及口头命令，并像今年早些时候OpenAI推出的类似技术一样更加强大。

Astra目前尚未向公众开放使用。