标签:视频生成
快手自研可灵AI:全面开放内测视频生成大模型,支持付费会员与模型升级
快手视频生成大模型可灵AI升级并推出付费会员体系 近日,快手旗下的视频生成大模型——可灵AI宣布完成基础模型的升级,并全面开放内测,同时推出了全新的付费会员体系。为了让更多用户体验到这项服务,用户每天登录即可免费获得66灵感值,这些灵感值可以用来兑换平台内的指定功能使用权或增值服务,例如大约可以生成6个免费视频。 升级后视频质量大幅提升 经过此次升级,用户生成的视频在画面构图、色调和整体美观度上有了明显的提高。此外,升级后的模型在处理运动幅度和运动准确性方面也取得了显著的进步。 会员体系满足...
高画质视频生成革命:70万用户热捧的‘可灵AI’首尾帧控制功能再升级,AI生成技术引领新潮流
随着人工智能技术的飞速发展,AI生成的短剧时代似乎已近在咫尺。近期,各种视频生成AI的Demo展示出令人惊叹的创意,无论是光影效果的真实感,还是丰富的想象力,都让人赞叹不已。其中,快手旗下的大模型“可灵AI”(Kling)尤为引人注目,它在生成大幅度运动时保持了良好的稳定性和细节处理,例如生成的奔跑半人马视频。可灵AI不仅支持文生视频,还能够进行图生视频、视频续写和多尺寸选择,功能日益完善。 在世界人工智能大会WAIC 2024上,可灵AI再次升级,发布了高画质版、首尾帧控制和相机镜头控制等功能,提升了视频的质...
AI技术惊艳央视:通义实验室视频生成,让兵马俑与宝石老舅共演EMO Rap盛宴
在古老的黄土高原,秦腔的回响唤醒了沉睡千年的兵马俑,带来了一场震撼人心的表演。在《2024中国・AI 盛典》中,通过阿里巴巴通义实验室的尖端技术EMO,兵马俑与宝石Gem共同演绎了《从军行》,生动再现历史与现代的交融。这项技术不仅让北宋文豪苏轼“复活”,与李玉刚共唱《水调歌头》,更在社交媒体上引发热议,如“高启强化身罗翔普法”等热门话题。 EMO是AI领域的创新之作,只需照片和音频,就能创造逼真的唱演视频,精确匹配音频节奏。在通义APP上,用户可以亲自体验EMO的魅力,参与“全民舞台”创作。EMO的技术基础——弱控制...
ShareGPT4V团队与中科大&上海AI Lab联合发布:百万级高质量视频数据集ShareCaptioner-Video,颠覆性差分滑窗视频描述,登顶数据集排行榜
提升视频生成质量:ShareGPT4V团队发布大规模高质量视频数据集 中国科学技术大学和上海AI实验室合作的ShareGPT4V团队,近期推出了一项里程碑式的成果——全新的视频数据集,该数据集荣登HuggingFace排行榜首位。这个数据集包含了超过3000小时的高质量视频,每段视频均配以详尽的文字描述,旨在改善视频生成的质量。通过使用该数据集,团队重新评估了北京大学的Open-Sora-Plan,发现视频生成的性能显著增强。 研究者们强调,高质量的视频-字幕数据对视频理解和生成任务至关重要。他们利用GPT-4v的视觉能力,构建了4万条带有...
Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级
潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...
英伟达投的Sora竞品免费了!网友挤爆服务器,120秒120帧支持垫图
近日,一款名为Dream Machine的视频生成AI引起轰动,因其120秒内可生成120帧的高清晰度视频而备受关注。这款AI工具免费提供给公众试用,导致服务器一度被网友的热情挤爆。Dream Machine采用Transformer架构,能创建物理精确、内容连贯且生动的视频场景。尽管目前使用需排队等待,但其出色的表现赢得了用户们的惊叹,有人甚至感到它对现有视频生成工具Sora构成竞争压力。 用户反馈显示,Dream Machine不仅适用于生成各种动作场景,还能处理二次元风格和动画效果。该模型由初创公司Luma AI开发,团队成员包括前英伟达研究人员...
独家专访Pika:Sora is not very hard to beat,我们的算法能够以小胜大|AI Pioneers
在人工智能领域,技术革新正以前所未有的速度推进,每一步发展都备受瞩目。在这个过程中,技术路径的创新和分歧并存,影响着众多跟随者。机器之心通过“AI Pioneers”栏目,聚焦于AGI时代的领导者,介绍在AI细分领域展现出领袖气质的创业公司。Pika是一家在视频生成领域崭露头角的公司,近期完成了8000万美元的B轮融资,计划扩大研究和工程师团队,挑战OpenAI的Sora。尽管Sora设定了新标准,但Pika认为通过智能方法和高效算法,他们有能力迎头赶上。Pika强调团队的实力、算法的创新和产品的实用性,计划在今年年底发布新一代产...
库里杜兰特“合舞”科目三,腾讯混元团队全新图生视频模型来了
腾讯混元团队携手中山大学和香港科技大学推出创新视频生成模型——Follow-Your-Pose-v2,使得多人视频动作生成成为可能。此模型不仅在推理速度上有所提升,还能处理复杂的多人场景,如多人跳舞。它具有优秀的泛化能力,能应对不同年龄、服装、人种和背景的挑战。此外,Follow-Your-Pose-v2可以利用日常照片和视频进行训练,无需高质量素材,甚至能解决人物遮挡的问题,确保多人动作的连贯性。 为了验证模型效果,团队创建了一个包含约4000帧的Multi-Character基准,并在TikTok和TED演讲数据集上进行测试,结果表明模型性能超...
剪映AI创作平台Dreamina将上线视频生成能力 附内测邀请入口
中国站长网(ChinaZ.com)透露,2月27日消息,剪映旗下的创新AI平台Dreamina正扩展其功能,即将推出视频制作功能。该平台已以其文本转创意图的能力受到用户欢迎,允许用户调整图片尺寸和选择模板。现在,Dreamina将这一创新带入视频领域,诚邀对AI创作有热情、有一定创作背景的用户抢先体验内测。 在图片生成上,Dreamina平台以简单高效著称。用户仅需输入简短文字,就能迅速生成引人注目的图像,大大降低了美图创作的门槛。无论是否具备专业技能,任何人都能轻松体验创作的乐趣。想要尝试Dreamina的神奇效果,可以访问其产品...
国内公司有望做出Sora吗?这支清华系大模型团队给出了希望
国内公司在视频生成领域已有深厚的技术积累,尤其在2023年底,预测视频生成将迎来爆发。然而,OpenAI在春节期间推出了Sora,能生成长达1分钟的流畅视频,引发业界对国内外AI技术差距的担忧。Sora的核心技术是将视觉数据转化为统一的patch表示,结合Transformer和扩散模型,展现出强大的扩展性。清华团队在2022年9月提出的U-ViT与此相似,采用Transformer架构,提高了训练效率,并在多个数据集上进行了实验。 生数科技作为国内领先团队,基于U-ViT架构,开发了多模态模型UniDiffuser,展示出在视觉任务上的优秀性能。尽管Sor...