OpenAI推出DALL·E 3丨AI绘图语义理解新高度!

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作

DALL·E 32.jpg

9月21日,OpenAI发布了新一代图像生成模型DALL·E 的最新迭代版本DALL·E 3,在图像生成质量和对语言理解的能力上都取得了大幅提升。

DALL·E 3最大的创新在于与OpenAI自然语言模型ChatGPT的深度集成,用户可以直接使用ChatGPT来生成图像提示语句,再提供给DALL·E 3进行图像生成。这可以减轻用户自己思考提示语句的负担。

OpenAI推出DALL-E 3

相比目前我们所使用的midjourney和sd等绘图模型,需要用户不断尝试提示词或使用lora和controlnet来控制生成结果,DALL·E 3可让用户在与chatgpt像常规对话一样完成自己的需求,类似于甲方与乙方。这也将是以后AI绘图模型的主要趋势,更少的学习成本,更多通过与AI沟通就可以完成自己的需求,代表了更加智能化的水平。

DALL·E 3的能力

从官方所展示的DALL-E 3的能力来看,DALL-E 3在以下几个方面的能力十分突出:

1.可在一张图中精准塑造多个角色

OpenAI推出DALL-E 3

2.可以理解语气的情感,表达提示词中的情绪。

OpenAI推出DALL-E 3

3.可以精准表达提示词中的强调。

OpenAI推出DALL-E 3

4.可以精准表达提示词中需求的文字。

OpenAI推出DALL-E 3

5.准确表达出提示词的内容

OpenAI推出DALL-E 3

与midjourney等模型相比,美观度上当然还是midjourney模型要好很多,但是DALL·E 3展现一种更为先进的人工智能方向。

DALL·E 3安全措施

DALL·E 3采取了一些安全措施,确保生成的内容不包含暴力、成人或仇恨内容。它还限制了生成特定公众人物的请求,以避免潜在的问题。为了提高安全性,团队与专家进行了合作,测试和改进模型在生成公众人物和视觉偏差方面的表现,以减少宣传和误导等风险。

团队还在内部进行测试,研究如何帮助人们识别由AI生成的图像。他们正在尝试一种名为"出处分类器"的新工具,以确定图像是否由DALL·E 3生成。这将有助于更好地了解生成图像的用途和来源。更多相关信息将会在未来分享。

重要的一点,为了保护创作者的创作权,DALL·E 3会拒绝生成以活着的艺术家的风格为基础的图像。创作者还可以选择将他们的图像排除在未来图像生成模型的训练之外,保持对自己作品的控制。

它的发布代表了AI绘图在语言理解和多模态生成方面达到新的高度。

DALL·E 3会首先在10月份向ChatGPT Plus和企业用户开放,之后再向研究机构和API服务用户开放。

https://openai.com/dall-e-3

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速、安全、高效、私密的UI设计团队云协作
立即部署>>
标记狮私有云部署-一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作