谷歌在周三宣布推出 Gemini 2.0,这是迄今为止其最先进的AI模型,全球科技巨头正竞相在快速发展的AI领域占据主导地位。
谷歌CEO Sundar Pichai 在发布会上描述新模型为AI开发的新纪元,系统设计用于理解并为用户做出关于周围世界的决策。
Pichai 表示,Gemini 2.0 的重点在于使信息更加有用,系统能够更好地理解上下文、进行多步思考,并代表用户执行监督操作。
AI巨头的竞争
谷歌加入了 OpenAI、Meta 和亚马逊的行列,加速推出越来越强大的AI模型。
尽管这些技术的巨大成本以及对其对经济的即时影响的争议,这些公司仍押注于下一轮AI驱动技术。一个关键焦点是AI代理——硅谷的主要目标之一——这是一种能够感知环境、做出决策并执行特定目标任务的数字助手。
科技巨头承诺,这样的代理将定义下一轮AI革命,这场革命始于2022年ChatGPT的推出,它重塑了公众对AI的期望。Gemini 2.0 推出
Gemini 2.0 模型最初将提供给开发者和受信任的测试者,并计划将其更广泛地整合到谷歌生态系统中,特别是在搜索和Gemini平台。
该技术由谷歌第六代TPU(张量处理单元)硬件Trillium驱动,现在已向客户普遍提供。
谷歌强调,Trillium 处理器仅用于训练和运行 Gemini 2.0。AI硬件竞赛
AI训练主要由Nvidia主导,其在该领域的主导地位使其成为世界上最有价值的公司之一。
随着Trillium的推出,谷歌希望在竞争激烈的AI硬件市场中占据一席之地。Gemini的影响
谷歌表示已有数百万开发者正在使用Gemini技术构建应用程序。
系统已整合到七个谷歌产品中,每个产品都有超过20亿用户。计划于2025年初推出增强搜索功能的更广泛部署,并逐步扩大AI概述覆盖更多国家和地区及语言。
Gemini 2.0 Flash
Gemini 2.0 家族的第一个模型Gemini 2.0 Flash提供了更快的性能,并支持多种输入类型——包括文本、图像、视频和音频——以及多样化的输出格式,如生成图像和文本转语音。
Gemini应用将在全球范围内整合2.0 Flash功能,并计划在2025年初扩展到其他谷歌产品。