标签:视频生成

Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级

潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...

英伟达投的Sora竞品免费了!网友挤爆服务器,120秒120帧支持垫图

近日,一款名为Dream Machine的视频生成AI引起轰动,因其120秒内可生成120帧的高清晰度视频而备受关注。这款AI工具免费提供给公众试用,导致服务器一度被网友的热情挤爆。Dream Machine采用Transformer架构,能创建物理精确、内容连贯且生动的视频场景。尽管目前使用需排队等待,但其出色的表现赢得了用户们的惊叹,有人甚至感到它对现有视频生成工具Sora构成竞争压力。 用户反馈显示,Dream Machine不仅适用于生成各种动作场景,还能处理二次元风格和动画效果。该模型由初创公司Luma AI开发,团队成员包括前英伟达研究人员...

独家专访Pika:Sora is not very hard to beat,我们的算法能够以小胜大|AI Pioneers

在人工智能领域,技术革新正以前所未有的速度推进,每一步发展都备受瞩目。在这个过程中,技术路径的创新和分歧并存,影响着众多跟随者。机器之心通过“AI Pioneers”栏目,聚焦于AGI时代的领导者,介绍在AI细分领域展现出领袖气质的创业公司。Pika是一家在视频生成领域崭露头角的公司,近期完成了8000万美元的B轮融资,计划扩大研究和工程师团队,挑战OpenAI的Sora。尽管Sora设定了新标准,但Pika认为通过智能方法和高效算法,他们有能力迎头赶上。Pika强调团队的实力、算法的创新和产品的实用性,计划在今年年底发布新一代产...

库里杜兰特“合舞”科目三,腾讯混元团队全新图生视频模型来了

腾讯混元团队携手中山大学和香港科技大学推出创新视频生成模型——Follow-Your-Pose-v2,使得多人视频动作生成成为可能。此模型不仅在推理速度上有所提升,还能处理复杂的多人场景,如多人跳舞。它具有优秀的泛化能力,能应对不同年龄、服装、人种和背景的挑战。此外,Follow-Your-Pose-v2可以利用日常照片和视频进行训练,无需高质量素材,甚至能解决人物遮挡的问题,确保多人动作的连贯性。 为了验证模型效果,团队创建了一个包含约4000帧的Multi-Character基准,并在TikTok和TED演讲数据集上进行测试,结果表明模型性能超...

剪映AI创作平台Dreamina将上线视频生成能力 附内测邀请入口

中国站长网(ChinaZ.com)透露,2月27日消息,剪映旗下的创新AI平台Dreamina正扩展其功能,即将推出视频制作功能。该平台已以其文本转创意图的能力受到用户欢迎,允许用户调整图片尺寸和选择模板。现在,Dreamina将这一创新带入视频领域,诚邀对AI创作有热情、有一定创作背景的用户抢先体验内测。 在图片生成上,Dreamina平台以简单高效著称。用户仅需输入简短文字,就能迅速生成引人注目的图像,大大降低了美图创作的门槛。无论是否具备专业技能,任何人都能轻松体验创作的乐趣。想要尝试Dreamina的神奇效果,可以访问其产品...

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

国内公司在视频生成领域已有深厚的技术积累,尤其在2023年底,预测视频生成将迎来爆发。然而,OpenAI在春节期间推出了Sora,能生成长达1分钟的流畅视频,引发业界对国内外AI技术差距的担忧。Sora的核心技术是将视觉数据转化为统一的patch表示,结合Transformer和扩散模型,展现出强大的扩展性。清华团队在2022年9月提出的U-ViT与此相似,采用Transformer架构,提高了训练效率,并在多个数据集上进行了实验。 生数科技作为国内领先团队,基于U-ViT架构,开发了多模态模型UniDiffuser,展示出在视觉任务上的优秀性能。尽管Sor...

谷歌AI新星转投Pika:视频生成Lumiere一作,担任创始科学家

Pika喜迎新科学家:谷歌视频生成项目主力Omer Bar-Tal加盟 量子位讯 - 2024年2月24日,Pika宣布了一项重要人事变动,谷歌视频生成研究者Omer Bar-Tal成为其创始科学家。Bar-Tal在谷歌的最新作品——视频生成模型Lumiere,引发了业界广泛关注。 Lumiere的发布让谷歌在视频生成领域崭露头角,其时空U-Net(STU-Net)架构独树一帜,实现对视频的高效处理。在完成约3000万个视频的学习后,Lumiere能执行多种任务,包括文字驱动的视频生成、编辑修复、图片转视频和风格转换,获得了谷歌首席科学家Jeff Dean的高度评价。 Bar-Tal...

AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型

欢迎来到【AI前沿】!每日探索智能科技的新鲜资讯,这里是你的AI导航站,带你紧跟行业热点,洞察技术脉搏,发现创新AI产品的无限可能。立刻探索最新AI产品:https://top.aibase.com/ ??AI动态曝光:OpenAI的Sora技术报告震撼发布,涵盖模拟现实与视频拓展,其强大超出想象!与此同时,Reddit携手AI企业,开启对内容付费的新模式,利用AI训练数据挖掘价值。 辟谣时间:谷歌Gemini1.5Pro声明称OpenAI的Sora视频生成技术存在虚假成分,AI视频之争愈演愈烈,Runway和Stability已积极应战。 转型之路:魅族全面拥抱AI,宣布告...

Sora刷屏背后:企业AI视频的爆发需求,与100元的付费意愿

近日,Sora产品的发布引起了广泛关注,它能依据文本描述生成长达60秒的连贯视频,正迎合了当前高涨的视频市场需求。然而,尽管需求强劲,企业愿付费用却呈急速下滑态势,半年内从每月千元降至约100元。据见实调查,AI生成视频的需求占比达到34.9%,成为企业第三大需求。无论是个人还是企业,大部分已有付费意向。Sora的诞生可能引领2024年企业降低成本、提高效率的新变革。 业内预测,Sora或将颠覆短视频直播领域,大幅削减制作成本。用户期待着由文字直接生成电影的新时代到来,内容创新和故事情节将更加关键。目前,AIGC...

Sora爆火48小时:杨立昆揭秘论文,参数量或仅30亿

OpenAI的新型大模型Sora引发热议,成为科技界的焦点。该模型引起马斯克等科技领袖的评论,并引发视频、影视等行业对职业前景的思考。Sora基于扩散Transformer论文,可能运用了谷歌的NaViT技术,参数量约为30亿。视频展示中,Sora展现了生成各种场景的能力,但也存在明显的技术瑕疵。 OpenAI CEO阿尔特曼的营销策略备受赞赏,有人猜测他选择在谷歌发布Gemini 1.5时推出Sora以抢占话题度。同时,OpenAI可能寻求超过800亿美元的估值,反映出对资金的紧迫需求。 专家们对Sora的看法各异,有的惊叹其潜力,如周鸿祎预测它将颠覆...
12