国产视频大模型奋起直追 Pika、阿里同日发布“对口型”利器

在AI多模态的激烈竞争中,视频生成成为科技巨头和新兴企业的焦点,尤其是AI视频生成技术。近日,PIKA推出了唇形同步功能,合作方ElevenLabs提供AI语音支持,而阿里巴巴则发布了更为先进的EMO框架,能生成包含丰富表情和姿势变化的视频。尽管PIKA目前限制在3秒分段同步,EMO则可生成任意时长且细节丰富的视频。值得注意的是,EMO的技术路径不同于Sora,基于Stable Diffusion 1.5改造,而非Transformer。

AI视频生成被认为是多模态应用的关键,如阿里Animate Anyone、字节跳动Magic Animate和微软GAIA等产品已显现其潜力。视频的多元信息表达能力使得AI视频工具在降低创作门槛的同时,拓宽了应用场景,有望助力各行各业的内容创新和效率提升。分析师认为,AI文生视频是多模态AIGC的下一个重要领域,而字节跳动也在秘密研发相关AI产品,反映出行业对这一领域的高度关注。

随着技术不断优化和更多玩家入场,多模态视频生成领域的创新将持续加速,为市场带来更多可能性和机遇。

本文来源: 财联社【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...