粉色连衣裙与美女
一位身穿粉色连衣裙、留着黑色大波浪发型的美女,惊恐地转过身来,露出了一个神似张宋小宝的娇俏面庞。她的嘴唇微张,似乎有话要说。
马斯克的新造型
美国的“三好青年”马斯克,竟然穿上了东北大花袄,站在白宫前。他双手插兜,略显局促地露出了一个拘谨而正派的微笑。
小樱与蕾姆的购物之旅
另一边,魔卡少女小樱正拉着隔壁的蕾姆在三里屯商场逛街。对于见过各种P图软件和AI技术的人来说,这些效果早已不再新鲜。有人甚至轻描淡写地说:“早半年前,我就见过这种效果了。不仅能给马斯克换装,还能让他跳舞。”
Vidu 1.5 的创新之处
然而,这些视频的生成方式可能与你之前见过的有所不同。这是生数科技联合清华团队推出的视频模型Vidu 1.5,具备多主体一致性的新能力。这意味着我们可以上传多张图片生成视频,并确保这些复杂元素不会变形。
视频生成的具体操作
例如,生成马斯克在白宫前穿大花袄的视频,只需上传一张马斯克的大头照、一件花袄和一张白宫的图片,再输入简单的提示词,Vidu就能生成一条以假乱真的视频。
多主体一致性的优势
这种方法的好处在于,我们可以手动控制AI生成的素材,让视频更符合我们的预期。以前,我们只能提供一句话或一张照片,让AI自由发挥,结果往往偏离预期。而现在,只需上传一张图片即可实现目标。
Vidu 的实际应用
Vidu模型发布后,外网网友们纷纷尝试。用户可以在Vidu官网上免费试用三次,之后每次试用需消耗4个积分。世超试用了该模型一天,生成了多个有趣的效果,如火锅戴着头盔骑雅迪电动车、乔布斯穿上军大衣等。
多主体生成的挑战
尽管Vidu在处理多主体时表现出色,但在动作较大或画面变化较多的情况下,仍会出现一些小bug。例如,将胖虎的玩具人偶放在冰雪女王的手上,虽然场景连贯,但胖虎的动作有些变形。
使用技巧
经过测试,世超发现使用背景较干净的图片作为主体,生成的准确率更高。同时,上传多个角度的照片也能使主体动作更自然。
未来展望
尽管Vidu在某些方面还需改进,但它在多主体处理上的进步不容忽视。目前,它还不足以完全替代视频工作者的工作,但绝对值得尝试。谁不想让喜欢的角色穿上自己挑选的衣服,或让心爱的IP角色和明星跨界同框呢?