借助先进的科技,现在只需上传一张照片,你就能轻松变身为各种角色,无论是科幻片中的英雄还是复古风的穿越人物。中山大学和联想的研究团队共同研发了一款名为ConsistentID的创新技术,它能在保留五官细节的同时,根据多模态面部提示生成多样化的肖像。ConsistentID在保持五官一致性方面超越了腾讯的photomaker和小红书的instantID。
这个系统包含两个核心部分:多模态面部ID生成器和ID保存网络。前者由细粒度多模态特征提取器和面部ID特征提取器组成,能捕捉并学习详细的面部信息。后者则利用面部文本和视觉提示,通过面部注意力定位策略确保ID信息不混淆,维持面部区域的一致性。
为了实现这一目标,研究团队构建了一个包含文本嵌入、面部嵌入和面部编码器的面部编码器框架,用于生成细粒度的多模态面部特征。此外,他们还创建了FGID数据集,以解决现有数据集在捕捉面部细节方面的不足,提供了细粒度身份一致性度量。
在实际应用中,ConsistentID生成的图像在眼睛、鼻子和嘴巴等关键面部特征上展现出高度一致性,优于Fastcomposer、IP-Adapter、Photomaker和InstantID等现有方法。在定量评估中,ConsistentID在多个指标上占据优势,且在生成速度上超越了基于IP-Adapter的方法。
如果你想要体验这个神奇的技术,可以访问试玩链接或查阅项目链接获取更多信息。
本文来源: 快科技【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...