每日AI快讯

OpenAI首个视频生成模型发布一句话生成1分钟高清视频

OpenAI近日推出了创新的Sora模型，这是一款革命性的文生视频工具，它基于DALL·E 3的技术，能依据文本描述产出长达1分钟的高清视频。该模型深入模仿实际物理环境，显著提升了AI解析和参与真实世界情境的能力。在实例展示中，Sora成功地根据'中国龙年春节'创建了一段生动的节日场景，舞龙活动栩栩如生，人群动态自然。另一部作品则展示了东京雨后的城市景象，水洼反射和霓虹灯效极其逼真，让人难以分辨是否出自AI之手。 OpenAI致力于教导AI理解并复制物理运动，期望借此解决涉及实际交互的难题。Sora已能创造包含多角色和复...

来源：

快科技【阅读原文】
Tags：AI生成视频 OpenAI Sora模型文生视频物理世界模拟

10个月前

效果炸裂！OpenAI首个视频生成模型发布，1分钟流畅高清，网友：整个行业RIP

近日，奥特曼推出OpenAI的创新成果——视频生成模型Sora，这是继DALL·E 3后的又一力作，可生成长达1分钟的高清视频。Sora展现了强大的场景构建能力，如热闹的春节、雨后东京的光影效果，甚至能模拟好莱坞电影预告片的质感。模型能理解并执行复杂的指令，如群体动态和物理交互，如纸飞机在森林中的飞行。然而，Sora尚存不足，如物理模拟精度和因果理解，有时会出现对象数量变化或空间细节混淆等问题。技术上，Sora基于扩散模型，采用Transformer架构，能处理不同格式的视觉数据，并利用DALL·E 3的重述提示词技术增强指令遵循...

来源：

量子位【阅读原文】
Tags：AI视频生成 DALL·E 3 OpenAI Sora 物理世界模拟视频生成模型

10个月前

48个文生视频+技术报告，揭秘OpenAI最强视频GPT

OpenAI推出了创新的文本生成视频模型Sora，这款模型可根据文字指示生成长达1分钟的高清视频，展现卓越的视觉效果和细节处理。Sora的独特之处在于其深度理解文本，能在单一视频中创建多个镜头，维持角色一致性。它还能理解物理属性，处理复杂场景，并支持文本指令、图像输入和视频编辑。 Sora采用Transformer架构，可扩展性强，能一次性生成或延长视频。通过多帧预见能力，保证主体在视线外时依然保持不变。相较于传统模型，Sora在原尺寸数据上训练，增加了灵活性和构图改进。它拥有强大的语言理解能力，通过训练高度描述性...

来源：

智东西【阅读原文】
Tags：OpenAI Sora 大模型文生视频生成视频

10个月前

1…203 204205

每日AI快讯

OpenAI首个视频生成模型发布 一句话生成1分钟高清视频

效果炸裂！OpenAI首个视频生成模型发布，1分钟流畅高清，网友：整个行业RIP

48个文生视频+技术报告，揭秘OpenAI最强视频GPT

OpenAI首个视频生成模型发布一句话生成1分钟高清视频