标签:视频生成
深度爆料:Sora负责人Tim Brooks转投谷歌麾下,与OpenAI及DeepMind竞争中带来视频生成技术新变局
最近一段时间,OpenAI 经历了一系列的风波。一方面,公司的高层频繁出现人员变动,重要成员接连离职;另一方面,它却成功获得了投资者的青睐,在高达 1570 亿美元的估值基础上,成功融资 66 亿美元。就在最近,OpenAI 发布了新的项目 Canvas 不久之后,又失去了 Sora 项目的重要负责人 Tim Brooks。他转而加入了竞争对手谷歌旗下的 DeepMind。 DeepMind 的联合创始人 Demis Hassabis 对此表示欢迎,并提到期待与 Tim Brooks 一起将创造世界模拟器的梦想变为现实。谷歌首席科学家 Jeff Dean 也表达了对 Tim Brooks 加入的欢...
美图:“奇想大模型”视频生成能力已完成全面升级,可生成 1 分钟视频
IT之家报道,美图公司在近日宣布,其旗下的“奇想大模型”视频生成技术已进行全面升级。此次升级不仅提升了视频生成的能力与效率,还大幅增强了模型的整体性能。结合美图公司在计算机视觉领域的多项自主研发技术,“奇想大模型”在视频生成时长、画质、流畅性、真实性和可信度等方面均有显著提升。 据了解,升级后的“奇想大模型”可以生成单次长达 5 秒的文本到视频或图像到视频的,并支持生成长达 1 分钟、24FPS、1080P 的高质量视频。这些功能将逐步应用于美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE 和 MOKI 等多款产...
昆仑万维发布SkyReels:AI短剧平台引领视频生成与内容创作新潮流
8月19日,昆仑万维宣布推出了SkyReels——一款集成视频大模型与3D大模型的AI短剧创作平台。该平台以“一键成剧”为核心理念,旨在让内容创作者轻松制作高质量的AI视频。SkyReels集成了剧本生成、角色定制、分镜设计、剧情、对话/背景音乐(BGM)以及影片合成等功能,极大地简化了创作流程,使创作周期从几周缩短至几小时。 技术革新与成本节约 昆仑万维运用游戏引擎技术和视频大模型混合构建了一个名为WorldEngine的平台,这使得视频生成的成本得以降低百倍以上。这一创新不仅提高了短剧的产能,还显著降低了制作成本。据昆仑万...
可灵AI Sora引领视频生成新趋势:快手短视频的人工智能过弯点?
自从Sora在今年初亮相以来,这款能够创建长达一分钟视频的文生视频模型迅速引起了国内科技公司的关注。不久之后,快手自主研发的视频生成大模型“可灵”也正式上线,它采用了与Sora类似的技术路径,能够生成符合物理规则且动作合理的视频片段。目前,已经有超过一百万人申请内测资格,其中三十多万人已经获得了体验资格,并产生了超过七百万条短视频。 近日,可灵AI宣布全面开放内测,并启动了付费会员体系。与此同时,其他公司也在紧锣密鼓地跟进。例如,智谱AI在七月推出了能够免费生成六秒视频的智谱清言模型。尽管大部分...
快手自研可灵AI:全面开放内测视频生成大模型,支持付费会员与模型升级
快手视频生成大模型可灵AI升级并推出付费会员体系 近日,快手旗下的视频生成大模型——可灵AI宣布完成基础模型的升级,并全面开放内测,同时推出了全新的付费会员体系。为了让更多用户体验到这项服务,用户每天登录即可免费获得66灵感值,这些灵感值可以用来兑换平台内的指定功能使用权或增值服务,例如大约可以生成6个免费视频。 升级后视频质量大幅提升 经过此次升级,用户生成的视频在画面构图、色调和整体美观度上有了明显的提高。此外,升级后的模型在处理运动幅度和运动准确性方面也取得了显著的进步。 会员体系满足...
高画质视频生成革命:70万用户热捧的‘可灵AI’首尾帧控制功能再升级,AI生成技术引领新潮流
随着人工智能技术的飞速发展,AI生成的短剧时代似乎已近在咫尺。近期,各种视频生成AI的Demo展示出令人惊叹的创意,无论是光影效果的真实感,还是丰富的想象力,都让人赞叹不已。其中,快手旗下的大模型“可灵AI”(Kling)尤为引人注目,它在生成大幅度运动时保持了良好的稳定性和细节处理,例如生成的奔跑半人马视频。可灵AI不仅支持文生视频,还能够进行图生视频、视频续写和多尺寸选择,功能日益完善。 在世界人工智能大会WAIC 2024上,可灵AI再次升级,发布了高画质版、首尾帧控制和相机镜头控制等功能,提升了视频的质...
AI技术惊艳央视:通义实验室视频生成,让兵马俑与宝石老舅共演EMO Rap盛宴
在古老的黄土高原,秦腔的回响唤醒了沉睡千年的兵马俑,带来了一场震撼人心的表演。在《2024中国・AI 盛典》中,通过阿里巴巴通义实验室的尖端技术EMO,兵马俑与宝石Gem共同演绎了《从军行》,生动再现历史与现代的交融。这项技术不仅让北宋文豪苏轼“复活”,与李玉刚共唱《水调歌头》,更在社交媒体上引发热议,如“高启强化身罗翔普法”等热门话题。 EMO是AI领域的创新之作,只需照片和音频,就能创造逼真的唱演视频,精确匹配音频节奏。在通义APP上,用户可以亲自体验EMO的魅力,参与“全民舞台”创作。EMO的技术基础——弱控制...
ShareGPT4V团队与中科大&上海AI Lab联合发布:百万级高质量视频数据集ShareCaptioner-Video,颠覆性差分滑窗视频描述,登顶数据集排行榜
提升视频生成质量:ShareGPT4V团队发布大规模高质量视频数据集 中国科学技术大学和上海AI实验室合作的ShareGPT4V团队,近期推出了一项里程碑式的成果——全新的视频数据集,该数据集荣登HuggingFace排行榜首位。这个数据集包含了超过3000小时的高质量视频,每段视频均配以详尽的文字描述,旨在改善视频生成的质量。通过使用该数据集,团队重新评估了北京大学的Open-Sora-Plan,发现视频生成的性能显著增强。 研究者们强调,高质量的视频-字幕数据对视频理解和生成任务至关重要。他们利用GPT-4v的视觉能力,构建了4万条带有...
Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级
潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...
英伟达投的Sora竞品免费了!网友挤爆服务器,120秒120帧支持垫图
近日,一款名为Dream Machine的视频生成AI引起轰动,因其120秒内可生成120帧的高清晰度视频而备受关注。这款AI工具免费提供给公众试用,导致服务器一度被网友的热情挤爆。Dream Machine采用Transformer架构,能创建物理精确、内容连贯且生动的视频场景。尽管目前使用需排队等待,但其出色的表现赢得了用户们的惊叹,有人甚至感到它对现有视频生成工具Sora构成竞争压力。 用户反馈显示,Dream Machine不仅适用于生成各种动作场景,还能处理二次元风格和动画效果。该模型由初创公司Luma AI开发,团队成员包括前英伟达研究人员...