利用Vidu的AI视频生成技术：以主体参照实现可控性视频创作，让林黛玉喝咖啡或与马斯克拍合影不再是梦

全球首发主体参照功能，让指定形象的角色在不同场景中动起来

近日，国内知名的AI视频生成模型Vidu推出了全新的「主体参照」功能。用户只需上传一张任意主体的照片，系统就能锁定这一主体的形象，并根据输入的描述词切换场景，输出主体一致的视频。无论是人物、动物、商品还是虚构角色，该功能都能确保其在视频生成中的一致性和可控性。

例如，上传一张林黛玉的照片，使用「主体参照」功能后，可以生成她穿着古装在现代咖啡馆喝咖啡的视频，画面效果自然、真实。此外，上传一张马斯克的照片，也能生成他在不同场景中变换的视频，人物造型始终与原图一致。

打破视频模型的局限性：可控性不足

视频大模型普遍存在的一个问题就是可控性不足。现有的视频模型在生成过程中，主体形象容易崩坏，导致视频连续性差，无法保证每次生成视频时主题、场景、风格等的一致性。此外，视频模型的输出结果具有较大随机性，细节控制也不够精细。

为了解决这一问题，业界曾尝试采用“先AI生图、再图生视频”的方法，但这种方法仍然存在问题，如AI绘图的一致性不完美，需要反复修改和局部重绘。而Vidu的「主体参照」功能通过“上传主体图+输入场景描述词”的方式，直接生成视频素材，大幅减少了工作量，并提高了视频创作的自由度和创新空间。

加速视频创作：3张定妆照完成故事短片，6小时搞定一支视频广告

「主体参照」功能不仅提升了视频创作的连贯性，还极大提升了创作效率。例如，青年导演李宁利用Vidu预创作了一段男主的视频片段，仅通过三张定妆照就生成了所有人物画面。这使得长篇叙事的创作变得更加简单自然。

此外，Vidu还在商业广告片方向展现了强大潜力。广告片的关键在于多个镜头、不同场景下品牌物形象的一致性。Vidu「主体参照」功能可以很好地实现这一点。例如，在跑步鞋广告案例中，仅通过一张商品图，便完成了所有视频画面的生成，跑步鞋的形象在整个视频中保持高度一致。据生数科技官方介绍，该视频仅一人花费6小时完成，大大节省了广告制作的成本。

结语：“主体参照”代表着AI完整叙事的开端

Vidu牵手海内外头部艺术家已产出百部优秀作品，全平台播放量破千万。面向专业创作领域，Vidu正与AI艺术家们合作探索AI赋能下的全新创作模式。例如，与北京电影节AIGC短片单元最佳影片得主、Ainimate Lab合作打造的动画短片《一路向南》，画面质量接近传统动画制作标准，但成本仅为传统流程的1/40。

在生数科技联合创始人兼CEO唐家渝看来，「主体参照」这一全新功能的上线，代表着AI完整叙事的开端。未来，视频创作行业将经历一场颠覆性的变革，用户只需动动手指、调调参数，就可以完成一部影像作品的创作，每一个作品背后都是用户基于AI构建出的独特世界观和自我表达。

本文来源：