标签:Diffusion Transformer

揭秘Sora技术路线:核心成员来自伯克利,基础论文曾被CVPR拒稿

Sora,这款新兴的艺术形式,源于AI生成视频的技术革新。OpenAI的最新杰作Sora,以其显著超越现有技术的高质量视频生成效果,让业界惊叹。这一突破得益于Diffusion Transformer(DiT)模型的创新应用,它通过操作视频和图像的时空patch,展现出多模态生成的强大潜力。 Sora的研发团队虽精干,核心成员包括Tim Brooks、William Peebles等,他们在视频生成领域有着深厚的学术背景,比如Brooks曾在谷歌和英伟达工作,并在UC Berkeley接受过Alyosha Efros的指导。Peebles的论文“Scalable diffusion models with transformers”为S...