快手开源Kolors可图文生图模型丨国内本土化AI模型标杆

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作

近日,国内快手团队在Hugging Face平台正式开源了其自研的第三代文本到图像生成模型Kolors可图。该模型以Stable Diffusion为基础框架,通过在海量中英文图文对数据集上的训练,取得了视觉效果和语义理解等方面的优异表现。

https://huggingface.co/Kwai-Kolors/Kolors

快手开源Kolors可图文生图模型丨国内本土化AI模型标杆_1.jpg

Kolors可图模型采用了全新的2.1版基座模型,专注提升在写实人像、艺术风格、复杂场景等方面的生成质量。在中文理解和还原上尤其下了功夫,能较好地捕捉和表达富有东方韵味的人物、景观、服饰等特色内容。技术测评显示,Kolors在图像清晰度、细节丰富度、语义准确性等指标上均有明显进步。

Kolors可图模型能够生成富有中国特色的自然景观,如长城、水墨山水画般的景致等,体现出对中国地理和艺术风格的理解。可以还原一些具有中国文化象征意义的场景,如古代市井街道、龙的形象等。在人物生成方面,模型能塑造出东方面孔特征,并结合一些中国服饰、发型等,如古装将军形象,比较贴合国人审美。甚至在一些现代都市场景中,也能看到一些中国特色的建筑、招牌等细节,增强了本土化氛围。文字书写方面,不仅支持英文,在中文字体、书法的生成上也有出众表现,如"Kolors"店招图片。

快手开源Kolors可图文生图模型丨国内本土化AI模型标杆_6.png

可以看出,Kolors可图模型在训练过程中融入了大量中国本土数据,通过对中国文化内涵的学习,使其能够更好地理解中文输入,捕捉中国人的认知和偏好,生成出符合国人审美情趣、富有中国韵味的高质量图像。

Kolors官网已同步上线最新版本供用户体验。从生成样例来看,Kolors对诸如人物面部细节、场景光影渲染、中文字体还原等方面都捕捉到位,体现出扎实的技术功底。官网还提供了丰富的使用案例和创意启发,帮助用户充分挖掘Kolors的想象力。

快手开源Kolors可图文生图模型丨国内本土化AI模型标杆_3.png

快手开源Kolors可图文生图模型丨国内本土化AI模型标杆_4.png

高质量的中文图文生成样本一直是AI训练的稀缺资源。快手Kolors的发布,有望为国内外研究者提供新的数据积累和模型基线,激发更多面向本土应用的优化和创新。

https://kolors.kuaishou.com/

标记狮私有云部署
一键部署标记狮至私有服务器,构建快速、安全、高效、私密的UI设计团队云协作
立即部署>>
标记狮私有云部署-一键部署标记狮至私有服务器,构建快速,安全,高效,私密的UI设计团队云协作