继发布Gemini后,Google又再发力啦!Google日前正式发布了AI生成图像模型Imagen的第二代产品Imagen 2,目前正在Google Cloud的Vertex AI平台上进行内部测试,仅面向部分通过审核的客户开放使用。
Imagen 2最大的升级在于图像质量和理解文本描述的能力显著提升,甚至不输给OpenAI的DALL-E 3。相比第一代Imagen,Imagen 2可以渲染更精美的图像细节,理解更长更复杂的文本描述并转换为图像。
Imagen 2最重要的升级在于增加了渲染文本和logo的功能。它可以生成各种文字内容、字形logo、抽象几何logo等元素,并可以将这些元素覆盖或嵌入到图像中的不同区域,如产品包装、服装、名片等。
Imagen 2支持7种语言的文本渲染,包括中文、英语、西班牙语等在内的多种语言,有利于广大非英语国家的用户。
相比DALL-E 3 Imagen 2可以对已有图像进行局部重绘和图像扩展。如果您需要对某区域细节进行补充和调整,只需要在提示文字中并指明目标区域,Imagen 2可以对局部图像进行细微调整。
Imagen 2使用了Google DeepMind团队自主研发的SynthID隐藏水印技术。这种技术可以为AI生成的每一张图像添加隐藏追溯信息,有助于判断图像来源,应对AI生成图像的潜在风险。不过目前检测水印的工具仅供Google内部使用。
目前Google没有透露其训练Imagen 2所用的数据集,也没有为可能无意中贡献数据的创作者提供选择权或补偿机制。这对一些创作者来说可能存在侵犯版权的风险。
除了Imagen 2外Google同时还发布了MusicFX、Duet AI for Developers并开放了Gemini API等多项更新。