标签:Diffusion模型

拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造

在AI领域,一项创新技术——“StableDrag”引起了广泛关注。这项技术源于对DragGAN和DragDiffusion的改进,旨在提供更稳定、精确的图像编辑体验。DragGAN和DragDiffusion虽能实现图像拖拽编辑,但存在点跟踪不准确和动作监督不足的问题。为解决这些问题,南京大学和腾讯的研究者开发了StableDrag,它采用判别式点跟踪和基于置信的潜在增强策略,提高了编辑的稳定性和精度。 StableDrag包括两个关键模块:判别点跟踪(Discriminative PT)和置信动作监督(Confident MS)。判别点跟踪利用卷积层权重的点跟踪算法,确保操纵点的精确定...

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

国内公司在视频生成领域已有深厚的技术积累,尤其在2023年底,预测视频生成将迎来爆发。然而,OpenAI在春节期间推出了Sora,能生成长达1分钟的流畅视频,引发业界对国内外AI技术差距的担忧。Sora的核心技术是将视觉数据转化为统一的patch表示,结合Transformer和扩散模型,展现出强大的扩展性。清华团队在2022年9月提出的U-ViT与此相似,采用Transformer架构,提高了训练效率,并在多个数据集上进行了实验。 生数科技作为国内领先团队,基于U-ViT架构,开发了多模态模型UniDiffuser,展示出在视觉任务上的优秀性能。尽管Sor...