Gemini推出新形象,谷歌最新动作对你意味着什么?

评论 · 6 浏览

谷歌推出了 Gemini 2.0,这是其迄今为止最先进的AI模型,专为代理型AI时代设计。这款实验性的 Gemini 2.0 Flash 在多模态推理、工具使用和处理速度上都有显著提升。它能够原生生成图像和音频,并能访问第三方应用程序。

在启动生成式AI旅程一年后,Google发布了其原生多模态模型Gemini 2.0的最新版本,这是一款它称之为迄今为止最强大的模型,旨在适应代理型AI时代。

ET将为您解释Gemini 2.0的新功能、访问途径以及应用场景。

与Gemini 2.0有何不同?

Google希望通过Gemini 2.0家族解锁一种新的代理型体验。

首先推出的是实验性的Gemini 2.0 Flash。

它具有内置用户界面操作能力,并改进了多模态推理、长文本理解、复杂指令执行和规划、组合函数调用、内置工具使用以及更低的延迟。

Gemini 2.0不仅能生成文本,还能生成图像和音频。

2.0 Flash还可以使用第三方应用程序和服务,使其能够访问Google搜索、执行代码等。

据称,2.0 Flash在关键基准测试中比Gemini 1.5 Pro快两倍。

从硬件方面来看,Gemini 2.0由Google第六代张量处理单元Trillium驱动。

现在Trillium已向客户开放,供其构建使用。

Gemini 2.0将在哪些地方可用?

开发者现在可以通过Gemini API和Google的AI开发平台AI Studio及Vertex AI访问实验性的2.0 Flash版本。

新的文本转语音和内置图像生成功能仅限于早期访问合作伙伴,预计一月份将进行更广泛的发布。

Google表示,它计划在明年年初将其产品扩展到Gemini 2.0。

一个新的名为“深度研究”的功能将在Gemini Advanced中提供。

这可以作为研究助手,帮助探索复杂主题并为用户编制报告。

评论