Google 实验室,Google 的实验部门,正在测试一款名为 Whisk 的新图像生成工具。
这款工具允许用户通过上传图片而非文字来提示系统,从而对照片进行重新混搭,改变主题、场景和风格。Whisk 使用了 Google 的图像生成模型 Imagen 3,结合了三张图片:一张作为主题图片,一张作为场景图片,还有一张作为风格图片。
例如,你可以选择一张自己的照片作为主题,一张未来主义的景观作为场景,还有一种动漫风格作为最终效果。模型会自动生成详细的图片描述,这些描述用于指导 Imagen 3 创建照片的重新混搭。
你还可以输入文字提示以进一步定义期望的结果,例如“主题人物正在骑着飞行自行车。”由于 Whisk 只关注每张图片中的几个关键特征,公司解释说结果可能不会完全符合你的期望。
例如,生成的主题人物可能在身高、体重、发型或肤色上有所不同。Google 表示你可以随时查看和编辑底层提示。目前这个实验仅对美国地区的用户开放,在 labs.google\/whisk 可以访问。