Runway Gen3深度评测:12小时见证AI视频创作巅峰,模型质量超群,生成速度引领行业,抽象风格独树一帜

在期待已久的等待后,Runway的Gen3版本终于向部分高级合作用户开放,其中包括我的朋友@闲人一坤。我有幸体验了12小时的内测,尝试了数百个案例,结果让我惊喜。Gen3在美学和模型质量上超越了Luma和可灵,虽然差异可能只是细微的提升,但在我看来,它无疑是当前的首选。目前,Gen3仅支持文本生成视频,图像生成和其他控制工具尚未上线,这让我有些迫不及待。

在与坤哥一起进行了近100个案例的测试后,我决定采用更系统的方法来评估。虽然我的测试方法相对初级,无法与专业实验室相比,但我还是设定了包括语义理解、画面细节、运动质量、镜头移动、一致性、衰减性等多个测试维度。然而,实际操作中我发现这样的测试过于繁复,需要大量时间和精力。因此,我简化了测试,将风格划分为写实、动画、科幻、玄幻和抽象五大类,每个风格选取10到15个提示词,每个提示词运行三次,尽管只有文本视频,但仍能大致了解模型的整体性能。

我利用AI生成提示词,如镜头语言、光影、主体描述等,并让GPT按照这些元素创建大量的提示。将这些提示应用到Gen3中,生成速度非常快,10秒的视频只需约90秒,远超Luma。所有案例我都记录在飞书文档中,感兴趣的朋友可以通过公众号获取链接。

以下是五个风格中各选的五个代表案例,展示了Gen3在不同场景下的表现。写实风格中,人物特写和风景最稳定,但涉及全景或中景时,人物肢体容易变形。动画风格则在2D、3D等各种风格的表现上稍显逊色。科幻风格是Gen3的强项,无论是变形机械还是科幻战斗,都能展现出惊人的视觉效果。玄幻风格虽然略逊于科幻,但在魔法和神话世界的表现仍有亮点。抽象风格的测试表明,Gen3在几何图形、色彩和运动方面的表现超出预期,对传统特效制作产生冲击。

总结来说,Runway Gen3凭借其在模型质量和审美上的优势,展现出了强大的潜力。虽然还有待完善,但它已经证明了自己的领先地位。

本文来源: ​数字生命卡兹克公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...