最新,腾讯发布个性化人像生成模型——PhotoMaker。该模型实现了一个强大的功能,那就是可以高效生成用户自定义的、写实或艺术化处理的人像图片。
PhotoMaker的核心创新在于提出并使用了“堆叠ID嵌入”技术,这个技术技术可以将用户上传的多个人像图片编码成一个统一的ID特征表达,以充分结合不同图片中该人的各种个性信息,从而使生成的人像图片风格保持高度一致。
与其他需要测试时调整参数的方法相比,PhotoMaker预先训练出的ID嵌入使其可以不需要额外调优就达到很好的个性化生成效果。
使用PhotoMaker非常简单。用户只需要上传一张或多张同一个人的人像照片,然后输入包含分类词的文本描述,例如“girl img”,再选择一种风格模板,最后点击提交,系统就会自动生成一张符合文本描述的个性化人像图片。
PhotoMaker支持生成多种写实或艺术风格的人像。
为了使PhotoMaker模型获得个性保留和生成能力,开发团队还专门设计了一个面向身份识别的数据构建流程,用构建好的大规模数据集进行模型训练。训练后的模型不仅可以保留人物身份特征,对文本描述也有很强的控制力。
目前,PhotoMaker的源代码和线上体验平台已经在GitHub和Hugging Face平台全面开源。
项目地址:https://photo-maker.github.io/
Github:https://github.com/TencentARC/PhotoMaker
写实风格体验地址:https://huggingface.co/spaces/TencentARC/PhotoMaker
其他风格体验地址:https://https://huggingface.co/spaces/TencentARC/PhotoMaker-Style