Segmind研发团队近日开源模型SSD-1B,SSD-1B是Stable Diffusion XL(SDXL)模型的精简版本,通过知识蒸馏技术,模型文件大小减少50%,计算速度提升60%,但可以生成与SDXL Base模型同质量的图像。
它训练数据涵盖了多个数据集,包括Grit和Midjourney等。
我们利用相同的提示词同时运行了SSD-1B和SDXL
SSD-1B:
SDXL:
在本案例中,在对prompt的理解上,SDXL更胜一筹。
据官方的介绍,作为一款高效的文本到图像生成模型,SSD-1B具有以下核心特征:
文本到图像生成能力强大,可以根据文字描述生成图像,拓展了创作的可能性。
通过知识蒸馏,模型运算速度比原版提升60%,适合实时应用场景及需要快速生成图像的需求。
训练数据丰富多样,提升了对各类文本提示的处理能力,可以生成匹配的高质量图像。
集成了多个专家模型的优势,改进了性能,生成图像质量更出色。
当然,SSD-1B也存在一些局限性需要注意:
在生成照片逼真的人物时,仍有进步空间。
处理复杂图像中的文字和构图时,保真度仍有不足。
由于采用的是自动编码器结构,在绝对的逼真度和复杂成像上仍有待进步。
尽管存在这些局限,SSD-1B的上线还是让Stable Diffusion系列模型更上一层楼,为未来的改进奠定了基础。