Sora爆火 马斯克急了!特斯拉才拥有最好的视频生成技术

OpenAI新推出的视频生成模型Sora引起了广泛关注。这款模型只需简单的提示词,即可生成长达1分钟的高清视频,被视为视频生成领域的重大突破。尽管目前仅限少数人试用,OpenAI CEO Sam Altman已在推特上接受在线订单,让人们有机会体验Sora。然而,Sora的发布也让特斯拉CEO马斯克表达了看法,他在Twitter上与OpenAI互动,暗示对其转变成营利公司的不满。

马斯克指出,特斯拉具备出色的现实世界模拟和视频生成技术,这可能优于Sora。Sora是一个基于扩散模型的创新,能统一处理不同格式的视频和图像。它的技术包括OpenAI先前在DALL·E 3和扩散型Transformer的研究。尽管Sora存在对复杂场景物理模拟不准和空间细节混淆的问题,但它仍得到了业界的高度评价。

相比之下,特斯拉的世界模型能预测多摄像头视角的未来情境,具有基于文本生成视频的能力,并理解3D空间和物理规则。特斯拉计划在未来利用额外的计算资源进一步发展这项技术。

Sora和特斯拉的视频生成技术虽有差异,但都展现了AI理解和模拟现实世界的能力,分别应用于视频生成和自动驾驶。两者的成就显示了AI在视觉认知领域的显著进步。

本文来源: 快科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...