清华团队利用AI技术整活：马斯克穿上东北大花袄、李白穿上背带裤，展现多主体一致性视频生成Vidu 1.5新成果

粉色连衣裙与美女
一位身穿粉色连衣裙、留着黑色大波浪发型的美女，惊恐地转过身来，露出了一个神似张宋小宝的娇俏面庞。她的嘴唇微张，似乎有话要说。

马斯克的新造型
美国的“三好青年”马斯克，竟然穿上了东北大花袄，站在白宫前。他双手插兜，略显局促地露出了一个拘谨而正派的微笑。

小樱与蕾姆的购物之旅
另一边，魔卡少女小樱正拉着隔壁的蕾姆在三里屯商场逛街。对于见过各种P图软件和AI技术的人来说，这些效果早已不再新鲜。有人甚至轻描淡写地说：“早半年前，我就见过这种效果了。不仅能给马斯克换装，还能让他跳舞。”

Vidu 1.5 的创新之处
然而，这些视频的生成方式可能与你之前见过的有所不同。这是生数科技联合清华团队推出的视频模型Vidu 1.5，具备多主体一致性的新能力。这意味着我们可以上传多张图片生成视频，并确保这些复杂元素不会变形。

视频生成的具体操作
例如，生成马斯克在白宫前穿大花袄的视频，只需上传一张马斯克的大头照、一件花袄和一张白宫的图片，再输入简单的提示词，Vidu就能生成一条以假乱真的视频。

多主体一致性的优势
这种方法的好处在于，我们可以手动控制AI生成的素材，让视频更符合我们的预期。以前，我们只能提供一句话或一张照片，让AI自由发挥，结果往往偏离预期。而现在，只需上传一张图片即可实现目标。

Vidu 的实际应用
Vidu模型发布后，外网网友们纷纷尝试。用户可以在Vidu官网上免费试用三次，之后每次试用需消耗4个积分。世超试用了该模型一天，生成了多个有趣的效果，如火锅戴着头盔骑雅迪电动车、乔布斯穿上军大衣等。

多主体生成的挑战
尽管Vidu在处理多主体时表现出色，但在动作较大或画面变化较多的情况下，仍会出现一些小bug。例如，将胖虎的玩具人偶放在冰雪女王的手上，虽然场景连贯，但胖虎的动作有些变形。

使用技巧
经过测试，世超发现使用背景较干净的图片作为主体，生成的准确率更高。同时，上传多个角度的照片也能使主体动作更自然。

未来展望
尽管Vidu在某些方面还需改进，但它在多主体处理上的进步不容忽视。目前，它还不足以完全替代视频工作者的工作，但绝对值得尝试。谁不想让喜欢的角色穿上自己挑选的衣服，或让心爱的IP角色和明星跨界同框呢？

本文来源：

快科技【阅读原文】

文章版权归作者所有，未经允许请勿转载。

449

583

542

1,123

283

476

暂无评论

您必须登录才能参与评论！

暂无评论...