标签:显著增强了时空上下文建模能力

N### 阿里巴巴通义万相2.1模型重磅升级:首次实现中文文字到视频生成,支持无限长1080P视频高效编解码,大幅提升图像和视频生成能力

感谢IT之家网友 动感超人233、風見暉一、Skyraver 提供的线索。据IT之家报道,阿里巴巴旗下的通义万相于1月10日推出了2.1版本模型升级。此次升级显著提升了视频生成和图像生成的能力。 在视频生成方面,通义万相2.1通过自主研发的高效VAE和DiT架构,增强了时空上下文建模能力。这使得该模型能够支持无限长1080P视频的高效编解码,并首次实现了中文文字到视频的生成功能,在VBench榜单上名列前茅。此外,通义万相2.1不仅支持中英文视频的一键生成艺术字,还提供了多种视频特效选项,如过渡、粒子效果和模拟等,以增强视觉表...