Sora AI视频生成技术:大厂与创企的商业化探索之路 — Diffusion Model与Transformer的应用

自从Sora在今年2月发布以来,国内的AI视频生成赛道迅速升温,各大企业和初创公司纷纷加入竞争行列。Sora以其出色的视频生成能力和长达一分钟的视频展示,引领了行业潮流。紧随其后,国内企业如字节跳动、快手、商汤、阿里达摩院等相继推出了自己的AI视频生成工具。这些工具不仅吸引了大量用户的关注,还推动了技术的快速迭代。

技术架构与创新

Sora的成功激发了其他公司对Diffusion ModelTransformer架构的深入研究。这两种技术路径各有千秋,而Sora创造性地将两者结合,形成了DiT(Diffusion + Transformer)架构,显著提高了视频生成的质量和连贯性。国内企业也开始采用类似的架构,力求在视频长度和技术成熟度上追赶上Sora。

应用与商业化探索

随着技术的进步,AI视频生成工具的商业化潜力逐渐显现。这些工具通常采用会员制度,允许用户支付一定费用以获取更多高级功能。此外,一些企业开始探索与内容创作者的合作模式,帮助他们利用AI技术创造高质量的内容。然而,商业化道路并非一帆风顺,许多公司仍在寻找最佳的商业模式。

面临的挑战

尽管取得了显著进展,但AI视频生成技术仍然面临一些挑战。其中最突出的问题之一是如何确保视频中人物和场景的一致性。目前,大多数工具依赖于“抽卡”的方式来生成较为满意的画面,这种方法效率低下且难以保证结果的一致性。此外,视频生成过程中的画面畸变也是一个普遍存在的问题。

本文来源: 光锥智能公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...