拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造

在AI领域,一项创新技术——“StableDrag”引起了广泛关注。这项技术源于对DragGAN和DragDiffusion的改进,旨在提供更稳定、精确的图像编辑体验。DragGAN和DragDiffusion虽能实现图像拖拽编辑,但存在点跟踪不准确和动作监督不足的问题。为解决这些问题,南京大学和腾讯的研究者开发了StableDrag,它采用判别式点跟踪和基于置信的潜在增强策略,提高了编辑的稳定性和精度。

StableDrag包括两个关键模块:判别点跟踪(Discriminative PT)和置信动作监督(Confident MS)。判别点跟踪利用卷积层权重的点跟踪算法,确保操纵点的精确定位。而置信动作监督则根据跟踪得分的最大值来调整监督策略,以优化编辑过程。实验结果表明,StableDrag在图像编辑质量和稳定性上优于DragGAN和DragDiffusion,且在DragBench基准上实现了优异的定量评估。

此外,研究人员还进行了详细的消融实验,验证了置信动作监督、判别点跟踪以及跟踪模块实用性的有效性。StableDrag不仅提升了编辑效果,还减少了计算成本,为点基图像编辑提供了强大的工具。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...