谷歌推出一款新颖的图像生成器,能够将三张图片巧妙融合成一幅全新的作品

评论 · 10 浏览

谷歌实验室正在测试一款名为Whisk的新图像生成工具。这款工具允许用户通过上传图片而不是文字来进行提示。Whisk 使用的是谷歌的 Imagen 3 技术,它可以将三张图片结合起来:一张是主题图片,一张是场景图片,还有一张是风格图片。

Google 实验室,Google 的实验部门,正在测试一款名为 Whisk 的新图像生成工具。

这款工具允许用户通过上传图片而非文字来提示系统,从而对照片进行重新混搭,改变主题、场景和风格。

Whisk 使用了 Google 的图像生成模型 Imagen 3,结合了三张图片:一张作为主题图片,一张作为场景图片,还有一张作为风格图片。

例如,你可以选择一张自己的照片作为主题,一张未来主义的景观作为场景,还有一种动漫风格作为最终效果。

模型会自动生成详细的图片描述,这些描述用于指导 Imagen 3 创建照片的重新混搭。

你还可以输入文字提示以进一步定义期望的结果,例如“主题人物正在骑着飞行自行车。

由于 Whisk 只关注每张图片中的几个关键特征,公司解释说结果可能不会完全符合你的期望。

例如,生成的主题人物可能在身高、体重、发型或肤色上有所不同。

Google 表示你可以随时查看和编辑底层提示。

目前这个实验仅对美国地区的用户开放,在 labs.google\/whisk 可以访问。

评论