谷歌发布最新AI模型：Gemini 2.0

谷歌在周三宣布推出 Gemini 2.0，这是迄今为止其最先进的AI模型，全球科技巨头正竞相在快速发展的AI领域占据主导地位。

谷歌CEO Sundar Pichai 在发布会上描述新模型为AI开发的新纪元，系统设计用于理解并为用户做出关于周围世界的决策。

Pichai 表示，Gemini 2.0 的重点在于使信息更加有用，系统能够更好地理解上下文、进行多步思考，并代表用户执行监督操作。

AI巨头的竞争

谷歌加入了 OpenAI、Meta 和亚马逊的行列，加速推出越来越强大的AI模型。

尽管这些技术的巨大成本以及对其对经济的即时影响的争议，这些公司仍押注于下一轮AI驱动技术。

一个关键焦点是AI代理——硅谷的主要目标之一——这是一种能够感知环境、做出决策并执行特定目标任务的数字助手。

科技巨头承诺，这样的代理将定义下一轮AI革命，这场革命始于2022年ChatGPT的推出，它重塑了公众对AI的期望。

Gemini 2.0 推出

Gemini 2.0 模型最初将提供给开发者和受信任的测试者，并计划将其更广泛地整合到谷歌生态系统中，特别是在搜索和Gemini平台。

该技术由谷歌第六代TPU（张量处理单元）硬件Trillium驱动，现在已向客户普遍提供。

谷歌强调，Trillium 处理器仅用于训练和运行 Gemini 2.0。

AI硬件竞赛

AI训练主要由Nvidia主导，其在该领域的主导地位使其成为世界上最有价值的公司之一。

随着Trillium的推出，谷歌希望在竞争激烈的AI硬件市场中占据一席之地。

Gemini的影响

谷歌表示已有数百万开发者正在使用Gemini技术构建应用程序。

系统已整合到七个谷歌产品中，每个产品都有超过20亿用户。

计划于2025年初推出增强搜索功能的更广泛部署，并逐步扩大AI概述覆盖更多国家和地区及语言。

Gemini 2.0 Flash

Gemini 2.0 家族的第一个模型Gemini 2.0 Flash提供了更快的性能，并支持多种输入类型——包括文本、图像、视频和音频——以及多样化的输出格式，如生成图像和文本转语音。

Gemini应用将在全球范围内整合2.0 Flash功能，并计划在2025年初扩展到其他谷歌产品。