Sora爆火48小时：杨立昆揭秘论文，参数量或仅30亿

OpenAI的新型大模型Sora引发热议，成为科技界的焦点。该模型引起马斯克等科技领袖的评论，并引发视频、影视等行业对职业前景的思考。Sora基于扩散Transformer论文，可能运用了谷歌的NaViT技术，参数量约为30亿。视频展示中，Sora展现了生成各种场景的能力，但也存在明显的技术瑕疵。

OpenAI CEO阿尔特曼的营销策略备受赞赏，有人猜测他选择在谷歌发布Gemini 1.5时推出Sora以抢占话题度。同时，OpenAI可能寻求超过800亿美元的估值，反映出对资金的紧迫需求。

专家们对Sora的看法各异，有的惊叹其潜力，如周鸿祎预测它将颠覆广告和短视频行业；有的担忧对初创公司的冲击，如贾扬清警告小型AI公司需迅速应对。技术爱好者通过与其他模型对比，发现Sora在长镜头上有优势，但也揭示出生成错误。

尽管Sora的视频存在逻辑错误，但其在视频长度和逼真度上的进步领先同行。Sora采用Transformer和扩散模型融合，通过加噪去噪学习视频生成，模拟现实世界的属性。技术大牛谢赛宁分析Sora可能使用了谷歌的NaViT技术，并推测模型参数量约为30亿。

Sora的出现预示着视频创作的变革，但同时也带来了造假风险和伦理问题。OpenAI在考虑何时开放Sora，以平衡技术创新和社会影响。尽管Sora在与谷歌Gemini 1.5的竞争中占优，但在实际应用上仍有很长的路要走。随着生成式AI的发展，将不断推动人类创造力的进化。

本文来源：

智东西【阅读原文】

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

暂无评论...