谷歌发布 Whisk丨一款结合多张图片生成创意的 AI 工具

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作

谷歌发布 Whisk丨一款结合多张图片生成创意的 AI 工具_10.jpg

谷歌最新上线了一款名为 Whisk 的生成式 AI 工具。与传统的通过文字生成图片的方式不同,Whisk 允许用户通过上传图片进行创作。它可以将图片的主体、背景和风格融合起来,生成全新的视觉作品。这一功能目前作为 Google Labs 的实验项目向美国用户开放。

Whisk 是一款基于 AI 的创意工具,用户只需拖入几张图片即可生成新的作品。用户可以上传一张图片作为“主体”,一张图片作为“背景”,再加上一张定义“风格”的图片。Whisk 会根据这些图片的特点,将它们组合成新的创意图像。

谷歌发布 Whisk丨一款结合多张图片生成创意的 AI 工具_8.webp

比如,用户可以上传一张宠物的照片作为主体,再选择一个森林的背景,同时用卡通风格的图片定义整体效果。最终生成的图像可能是一只在森林中以卡通风格呈现的宠物。除了单纯的图片创作,Whisk 还支持生成搪瓷徽章、贴纸风格的图像等。

谷歌发布 Whisk丨一款结合多张图片生成创意的 AI 工具_7.jpeg

Whisk 的工作流程依赖于谷歌的两大模型:Gemini 和 Imagen 3。Gemini 会自动分析并描述用户上传的图片,为图片生成详细的文字说明(例如“这是一只站在草地上的橘猫”)。随后,Imagen 3 根据这些文字说明生成新的图像。

由于Whisk 并不会直接复制用户的图片,而是提取图片的一些关键特征进行创作。因此,生成的图像可能与原始图片存在一定差异,例如主体的高度、颜色或细节可能会有所变化。用户可以查看和调整生成的提示文本,以更接近自己的期望。

Whisk 的定位是一款创意工具,而非传统的图片编辑器。它更注重快速探索创意,而不是精细化的图像编辑。这对于需要快速生成设计灵感的用户来说非常实用,比如插画师、设计师或手工爱好者。

一些可能的应用场景包括:

  • 设计个性化的贴纸或徽章

  • 为手帐或 DIY 项目快速生成素材

  • 探索不同风格的图像表现方式

  • 谷歌发布 Whisk丨一款结合多张图片生成创意的 AI 工具_3.webp

不过,由于 Whisk 提取的是图片的“核心特征”而非完全复制原图,其生成效果可能与用户的预期有所偏差。如果需要的是精确的图像编辑,这款工具可能无法满足需求。

目前,Whisk 仅在美国开放试用,用户可以通过 labs.google/whisk 访问并体验。这一工具仍处于实验阶段,未来可能会根据用户反馈进行调整和改进。

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速、安全、高效、私密的UI设计团队云协作
立即部署>>
标记狮私有云部署-一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作