今天,聊天机器人能够回答问题、写诗和生成图像。
未来,它们还可能自主完成像在线购物这样的任务,并与电子表格等工具协作。谷歌在周三推出了一种这种技术的原型,人工智能研究人员称之为AI代理。谷歌是众多正在开发AI代理的科技公司之一。
包括OpenAI和Anthropic在内的多家人工智能初创公司也推出了类似的原型,这些原型能够使用软件应用程序、网站和其他在线工具。谷歌的新原型名为Mariner,基于Gemini 2.0,这也是谷歌在同一天推出的最新技术。
Gemini是支撑谷歌许多AI产品和研究实验的核心技术。Gemini版本将为同名聊天机器人和Google搜索工具“AI概览”提供动力,“AI概览”能够直接回答用户的问题。谷歌项目经理Jaclyn Konzelmann在接受《纽约时报》采访时说:“我们基本上允许用户在浏览器中输入请求,让Mariner代表他们采取行动。
”Gemini是一种神经网络——一种可以通过分析大量数据来学习技能的数学系统。
例如,通过识别互联网上文章和书籍中的模式,神经网络可以学会自行生成文本。最新的Gemini版本可以从文本、图像和声音等多种数据中学习。通过借鉴Gemini所学的知识,Mariner可以代表计算机用户使用类似的服务。
它可以理解需要点击某个按钮才能使事情发生,并且可以在现实世界中采取行动。Konzelmann在接受《纽约时报》采访时说:“Mariner是设计成与人类协同工作的。
”例如,如果用户在浏览器标签页中处于活跃状态,它可以帮助用户将杂货添加到虚拟购物车中,但不会实际购买这些商品。用户仍需完成购买。谷歌CEO Sundar Pichai在博客中表示,这些进展将使我们更接近于实现一个通用助手的梦想。
该项目作为Google流行浏览器Chrome的扩展开发而成,成为公司未来AI野心的重要平台。然而这些计划可能会面临挫折。
美国司法部要求一名联邦法官迫使谷歌出售或剥离Chrome浏览器,在一项具有里程碑意义的裁决后认定其搜索引擎构成非法垄断。Konzelmann承认,与其他聊天机器人一样,Mariner也会犯错。
因为这些系统根据大量数据中的模式运行,在某些情况下会出错。当聊天机器人生成文本时出现的错误有时不易察觉,但在系统尝试使用网站并采取其他行动时则更为严重。Konzelmann说:“它还不总是准确的。
”她表示这仍是一项实验性技术。目前谷歌仅向公司外部的小部分测试者分享了Mariner,并未公布广泛的发布计划。
在周三的活动中,谷歌还展示了Project Astra的新版本——一款智能手机数字助手。Astra能够响应图像、文本以及口头命令,并像今年早些时候OpenAI推出的类似技术一样更加强大。Astra目前尚未向公众开放使用。