DragGAN:AI新技术,让图像“拖”成你想要的样子

发表于 2023-05-23

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

如果你觉得AI出图太麻烦，每次要进行多次地微调，或者进行局部重绘，那你一定要看看下面的内容：

来自马克斯·普朗克计算机科学研究所、MIT CSAIL和Google的研究员，研究了一种新的GAN控制方法 DragGAN。它利用生成对抗网络(GAN),让用户可以直接在图像上进行拖拽调整,精确控制图片中物体的姿态、形状、表情和布局。

DragGAN提供了前所未有的精度和灵活性,可以操控人类、动物、汽车、风景等各种类别的图像。DragGAN解决了AI生图不可控的难题,通过拖拽动作确定生成图像的起点和终点,再根据对象的物理结构,在精细尺度上,用GAN生成符合逻辑的图像。

该模型预计6月就会开源啦！

GAN是什么？

GAN的全称是Generative adversarial network，中文翻译过来就是生成对抗网络。

1.GAN是一种深度学习模型，由两个神经网络组成：生成器和判别器。生成器的作用是生成数据，而判别器的作用是判断数据是否真实。这两个网络相互对抗，不断调整自己的参数，最终生成出逼真的数据

2. DragGAN让用户可以在图片上选择任意数量的“手柄点”和对应的“目标点”。通过移动手柄点达到目标,用户可以控制图片的空间属性,不受对象类别限制。

3. DragGAN的效果类似Photoshop的“扭曲变形”工具,但更强大,因为它不是简单“挤压像素”,而是“重新生成物体”,甚至可以转换三维图片。实例案例:用户可以将毕加索的画作《可爱的女孩》中女孩的手臂向上拖动,改变其姿态;可以将一张正脸图片转换为侧脸图片,甚至将人脸旋转90度。

4. 通过DragGAN,用户可以随意拖动图片中的任何一点,改变单个像素的组织和存在,并利用AI生成全新的像素,产生定制的视觉效果。

5. DragGAN的输出效果非常真实自然,没有明显的失真、闭塞或形变。它在图像处理和点跟踪上都胜过以往的方法。

6. 未来,DragGAN甚至可以通过GAN反转,直接操作真实图片。这将彻底改变我们对图片编辑的认知。

DragGAN技术应用范围

DragGAN技术的应用范围十分广泛,包括但不限于图片生成、修复、超分辨率、风格转换、视频生成等。

这项新技术正重塑着图像编辑领域,例如:

1.历史图片修复:可以修复老照片中的破损、折痕和失真,甚至可以为黑白照片添加颜色

2.影视后期:可以通过DragGAN轻松修改和调整影视作品中的场景、道具、角色等元素。

3.电商图片优化:可以利用DragGAN快速生成电商商品的多角度效果图和模型效果图。

4.虚拟试衣:DragGAN可以通过拖拽手势快速生成不同造型和着装的虚拟人像,实现在线虚拟试衣的体验。

5.图像编辑软件:PS等图像编辑工具可集成DragGAN技术,提供更加智能和自然的图像编辑功能。

draggan

传说中的”让大象转过来“可以实现啦！

https://github.com/XingangPan/DragGAN