谷歌推出能独立使用网站的AI代理

评论 · 16 浏览

谷歌最新推出的原型产品名为“航海者”(Mariner),它基于 Gemini 2.0 技术。Gemini 是谷歌的核心人工智能技术,支撑着该公司众多的 AI 产品和研究实验。该系统将为谷歌同名聊天机器人和直接回答用户问题的搜索工具“AI概览”提供动力。

今天,聊天机器人可以回答问题、写诗和生成图像。

未来,它们还可能自主执行任务,如在线购物,并与电子表格等工具合作。

谷歌在周三发布了一款此类技术的原型,研究人员称之为AI代理。

谷歌是众多正在开发AI代理的科技公司之一。

包括OpenAI和Anthropic在内的各种AI初创公司也发布了类似原型,这些原型能够使用软件应用程序、网站和其他在线工具。

谷歌的新原型名为Mariner,基于Gemini 2.0,该公司也在同一天发布了Gemini。

Gemini是支撑谷歌众多AI产品和研究实验的核心技术。

该系统的版本将为同名聊天机器人和Google搜索工具AI Overviews提供动力,后者可以直接回答用户的问题。

谷歌项目经理Jaclyn Konzelmann在接受《纽约时报》采访时说:“我们基本上允许用户在浏览器中输入请求,并由Mariner代为执行操作。

Gemini是一种神经网络——一种通过分析大量数据来学习技能的数学系统。

例如,通过识别互联网上文章和书籍中的模式,神经网络可以学会自己生成文本。

最新的Gemini版本从文本、图像和声音等多种数据中学习。

Mariner可以根据Gemini学到的知识使用类似的在线服务。

它可以理解需要点击按钮才能触发某些操作,并且可以在现实世界中采取行动。

Konzelmann表示,Mariner是设计成与人类协同工作的。

例如,在用户处于活动浏览器标签页时,它可以将虚拟购物车填满杂货,但不会实际购买这些杂货。

用户仍需完成购买。

谷歌CEO Sundar Pichai在一篇博文中表示,这些进展使我们更接近于实现通用助手的愿景。

该项目作为Google流行的网络浏览器Chrome的扩展开发而成,成为公司未来AI雄心的重要平台。

然而,这些计划可能会面临挫折。

司法部已要求联邦法官强制谷歌出售或剥离Chrome浏览器,在一项具有里程碑意义的判决后认定谷歌搜索引擎构成非法垄断。

还有其他挑战。

Konzelmann承认与其他聊天机器人一样,Mariner也会犯错。

由于这些系统根据大量数据中的模式运行,在某些情况下会出现偏差。

当聊天机器人生成文本时出现的错误有时不易察觉,但在系统尝试使用网站并采取其他行动时,则更为严重。

Konzelmann说:“它还不总是准确的。

”这仍然是一项实验性技术。

目前,谷歌仅与公司外部的一小部分测试者分享了Mariner,并未公布更广泛的发布计划。

在周三的展示中,该公司还展示了Project Astra的新版本——一种智能手机数字助手。

它可以响应图像、文本以及口头命令。

Astra是比苹果Siri更强大的数字助手版本,并且目前尚未向公众开放使用。

评论