Sora爆火48小时:杨立昆揭秘论文,参数量或仅30亿

OpenAI的新型大模型Sora引发热议,成为科技界的焦点。该模型引起马斯克等科技领袖的评论,并引发视频、影视等行业对职业前景的思考。Sora基于扩散Transformer论文,可能运用了谷歌的NaViT技术,参数量约为30亿。视频展示中,Sora展现了生成各种场景的能力,但也存在明显的技术瑕疵。

OpenAI CEO阿尔特曼的营销策略备受赞赏,有人猜测他选择在谷歌发布Gemini 1.5时推出Sora以抢占话题度。同时,OpenAI可能寻求超过800亿美元的估值,反映出对资金的紧迫需求。

专家们对Sora的看法各异,有的惊叹其潜力,如周鸿祎预测它将颠覆广告和短视频行业;有的担忧对初创公司的冲击,如贾扬清警告小型AI公司需迅速应对。技术爱好者通过与其他模型对比,发现Sora在长镜头上有优势,但也揭示出生成错误。

尽管Sora的视频存在逻辑错误,但其在视频长度和逼真度上的进步领先同行。Sora采用Transformer和扩散模型融合,通过加噪去噪学习视频生成,模拟现实世界的属性。技术大牛谢赛宁分析Sora可能使用了谷歌的NaViT技术,并推测模型参数量约为30亿。

Sora的出现预示着视频创作的变革,但同时也带来了造假风险和伦理问题。OpenAI在考虑何时开放Sora,以平衡技术创新和社会影响。尽管Sora在与谷歌Gemini 1.5的竞争中占优,但在实际应用上仍有很长的路要走。随着生成式AI的发展,将不断推动人类创造力的进化。

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...