今天,聊天机器人可以回答问题、写诗和生成图像。
未来,它们还可能自主执行任务,如在线购物,并与电子表格等工具合作。谷歌在周三发布了一款此类技术的原型,研究人员称之为AI代理。谷歌是众多正在开发AI代理的科技公司之一。
包括OpenAI和Anthropic在内的各种AI初创公司也发布了类似原型,这些原型能够使用软件应用程序、网站和其他在线工具。谷歌的新原型名为Mariner,基于Gemini 2.0,该公司也在同一天发布了Gemini。Gemini是支撑谷歌众多AI产品和研究实验的核心技术。
该系统的版本将为同名聊天机器人和Google搜索工具AI Overviews提供动力,后者可以直接回答用户的问题。谷歌项目经理Jaclyn Konzelmann在接受《纽约时报》采访时说:“我们基本上允许用户在浏览器中输入请求,并由Mariner代为执行操作。
”Gemini是一种神经网络——一种通过分析大量数据来学习技能的数学系统。
例如,通过识别互联网上文章和书籍中的模式,神经网络可以学会自己生成文本。最新的Gemini版本从文本、图像和声音等多种数据中学习。Mariner可以根据Gemini学到的知识使用类似的在线服务。
它可以理解需要点击按钮才能触发某些操作,并且可以在现实世界中采取行动。Konzelmann表示,Mariner是设计成与人类协同工作的。
例如,在用户处于活动浏览器标签页时,它可以将虚拟购物车填满杂货,但不会实际购买这些杂货。用户仍需完成购买。谷歌CEO Sundar Pichai在一篇博文中表示,这些进展使我们更接近于实现通用助手的愿景。
该项目作为Google流行的网络浏览器Chrome的扩展开发而成,成为公司未来AI雄心的重要平台。然而,这些计划可能会面临挫折。
司法部已要求联邦法官强制谷歌出售或剥离Chrome浏览器,在一项具有里程碑意义的判决后认定谷歌搜索引擎构成非法垄断。还有其他挑战。
Konzelmann承认与其他聊天机器人一样,Mariner也会犯错。
由于这些系统根据大量数据中的模式运行,在某些情况下会出现偏差。当聊天机器人生成文本时出现的错误有时不易察觉,但在系统尝试使用网站并采取其他行动时,则更为严重。
Konzelmann说:“它还不总是准确的。
”这仍然是一项实验性技术。目前,谷歌仅与公司外部的一小部分测试者分享了Mariner,并未公布更广泛的发布计划。
在周三的展示中,该公司还展示了Project Astra的新版本——一种智能手机数字助手。
它可以响应图像、文本以及口头命令。Astra是比苹果Siri更强大的数字助手版本,并且目前尚未向公众开放使用。