全球首发主体参照功能,让指定形象的角色在不同场景中动起来
近日,国内知名的AI视频生成模型Vidu推出了全新的「主体参照」功能。用户只需上传一张任意主体的照片,系统就能锁定这一主体的形象,并根据输入的描述词切换场景,输出主体一致的视频。无论是人物、动物、商品还是虚构角色,该功能都能确保其在视频生成中的一致性和可控性。
例如,上传一张林黛玉的照片,使用「主体参照」功能后,可以生成她穿着古装在现代咖啡馆喝咖啡的视频,画面效果自然、真实。此外,上传一张马斯克的照片,也能生成他在不同场景中变换的视频,人物造型始终与原图一致。
打破视频模型的局限性:可控性不足
视频大模型普遍存在的一个问题就是可控性不足。现有的视频模型在生成过程中,主体形象容易崩坏,导致视频连续性差,无法保证每次生成视频时主题、场景、风格等的一致性。此外,视频模型的输出结果具有较大随机性,细节控制也不够精细。
为了解决这一问题,业界曾尝试采用“先AI生图、再图生视频”的方法,但这种方法仍然存在问题,如AI绘图的一致性不完美,需要反复修改和局部重绘。而Vidu的「主体参照」功能通过“上传主体图+输入场景描述词”的方式,直接生成视频素材,大幅减少了工作量,并提高了视频创作的自由度和创新空间。
加速视频创作:3张定妆照完成故事短片,6小时搞定一支视频广告
「主体参照」功能不仅提升了视频创作的连贯性,还极大提升了创作效率。例如,青年导演李宁利用Vidu预创作了一段男主的视频片段,仅通过三张定妆照就生成了所有人物画面。这使得长篇叙事的创作变得更加简单自然。
此外,Vidu还在商业广告片方向展现了强大潜力。广告片的关键在于多个镜头、不同场景下品牌物形象的一致性。Vidu「主体参照」功能可以很好地实现这一点。例如,在跑步鞋广告案例中,仅通过一张商品图,便完成了所有视频画面的生成,跑步鞋的形象在整个视频中保持高度一致。据生数科技官方介绍,该视频仅一人花费6小时完成,大大节省了广告制作的成本。
结语:“主体参照”代表着AI完整叙事的开端
Vidu牵手海内外头部艺术家已产出百部优秀作品,全平台播放量破千万。面向专业创作领域,Vidu正与AI艺术家们合作探索AI赋能下的全新创作模式。例如,与北京电影节AIGC短片单元最佳影片得主、Ainimate Lab合作打造的动画短片《一路向南》,画面质量接近传统动画制作标准,但成本仅为传统流程的1/40。
在生数科技联合创始人兼CEO唐家渝看来,「主体参照」这一全新功能的上线,代表着AI完整叙事的开端。未来,视频创作行业将经历一场颠覆性的变革,用户只需动动手指、调调参数,就可以完成一部影像作品的创作,每一个作品背后都是用户基于AI构建出的独特世界观和自我表达。
本文来源: 智东西【阅读原文】