标签:视频生成

字节跳动猛攻AI领域:大模型与豆包视频生成技术如何引领未来AI硬件潮流?

近日,大模型行业再次掀起了一场“价格战”,阿里云宣布旗下通义千问的多款商业化产品大幅降价。早在今年5月,大模型行业已经经历了一轮降幅近90%的价格战。在这场激烈的竞争中,最终能够存活的通用大模型可能不超过五个。对于字节跳动这家新兴的互联网大厂而言,其在大模型领域的布局相对较晚,但凭借“大力出奇迹”的拼劲,其AI智能助手“豆包”已成为国内用户最多的原生AI应用。 近日,字节跳动又带来了两大新动作:一是发布了一系列新的大模型,包括视频生成模型、音乐模型和同声传译模型;二是正在探索开发AI硬件,首款产品...

扎克伯格引领潮流!Meta Movie Gen视频生成技术震撼登场,高清视频与个性化视频生成让创意无限延伸

扎克伯格近期在全球范围内引起了广泛关注。不久前,他展示了一款历经十年研发的AR眼镜Meta Orion,这款原型机虽然尚未正式上市,但已经抢尽了苹果Vision Pro的风头。而在最近的一次活动中,Meta再次展示了其在视频生成领域的突破性进展。 Meta宣布推出了全新的Meta Movie Gen,这是迄今为止最先进的“媒体基础模型”。尽管Meta官方尚未公布具体的开放时间表,但他们表示正在积极与娱乐行业的专业人士和创作者进行沟通与合作,预计将在明年将这一技术整合到Meta的产品和服务中。 Meta Movie Gen的主要特点包括: - 个性化视频...

深度爆料:Sora负责人Tim Brooks转投谷歌麾下,与OpenAI及DeepMind竞争中带来视频生成技术新变局

最近一段时间,OpenAI 经历了一系列的风波。一方面,公司的高层频繁出现人员变动,重要成员接连离职;另一方面,它却成功获得了投资者的青睐,在高达 1570 亿美元的估值基础上,成功融资 66 亿美元。就在最近,OpenAI 发布了新的项目 Canvas 不久之后,又失去了 Sora 项目的重要负责人 Tim Brooks。他转而加入了竞争对手谷歌旗下的 DeepMind。 DeepMind 的联合创始人 Demis Hassabis 对此表示欢迎,并提到期待与 Tim Brooks 一起将创造世界模拟器的梦想变为现实。谷歌首席科学家 Jeff Dean 也表达了对 Tim Brooks 加入的欢...

美图:“奇想大模型”视频生成能力已完成全面升级,可生成 1 分钟视频

IT之家报道,美图公司在近日宣布,其旗下的“奇想大模型”视频生成技术已进行全面升级。此次升级不仅提升了视频生成的能力与效率,还大幅增强了模型的整体性能。结合美图公司在计算机视觉领域的多项自主研发技术,“奇想大模型”在视频生成时长、画质、流畅性、真实性和可信度等方面均有显著提升。 据了解,升级后的“奇想大模型”可以生成单次长达 5 秒的文本到视频或图像到视频的,并支持生成长达 1 分钟、24FPS、1080P 的高质量视频。这些功能将逐步应用于美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE 和 MOKI 等多款产...

昆仑万维发布SkyReels:AI短剧平台引领视频生成与内容创作新潮流

8月19日,昆仑万维宣布推出了SkyReels——一款集成视频大模型与3D大模型的AI短剧创作平台。该平台以“一键成剧”为核心理念,旨在让内容创作者轻松制作高质量的AI视频。SkyReels集成了剧本生成、角色定制、分镜设计、剧情、对话/背景音乐(BGM)以及影片合成等功能,极大地简化了创作流程,使创作周期从几周缩短至几小时。 技术革新与成本节约 昆仑万维运用游戏引擎技术和视频大模型混合构建了一个名为WorldEngine的平台,这使得视频生成的成本得以降低百倍以上。这一创新不仅提高了短剧的产能,还显著降低了制作成本。据昆仑万...

可灵AI Sora引领视频生成新趋势:快手短视频的人工智能过弯点?

自从Sora在今年初亮相以来,这款能够创建长达一分钟视频的文生视频模型迅速引起了国内科技公司的关注。不久之后,快手自主研发的视频生成大模型“可灵”也正式上线,它采用了与Sora类似的技术路径,能够生成符合物理规则且动作合理的视频片段。目前,已经有超过一百万人申请内测资格,其中三十多万人已经获得了体验资格,并产生了超过七百万条短视频。 近日,可灵AI宣布全面开放内测,并启动了付费会员体系。与此同时,其他公司也在紧锣密鼓地跟进。例如,智谱AI在七月推出了能够免费生成六秒视频的智谱清言模型。尽管大部分...

快手自研可灵AI:全面开放内测视频生成大模型,支持付费会员与模型升级

快手视频生成大模型可灵AI升级并推出付费会员体系 近日,快手旗下的视频生成大模型——可灵AI宣布完成基础模型的升级,并全面开放内测,同时推出了全新的付费会员体系。为了让更多用户体验到这项服务,用户每天登录即可免费获得66灵感值,这些灵感值可以用来兑换平台内的指定功能使用权或增值服务,例如大约可以生成6个免费视频。 升级后视频质量大幅提升 经过此次升级,用户生成的视频在画面构图、色调和整体美观度上有了明显的提高。此外,升级后的模型在处理运动幅度和运动准确性方面也取得了显著的进步。 会员体系满足...

高画质视频生成革命:70万用户热捧的‘可灵AI’首尾帧控制功能再升级,AI生成技术引领新潮流

随着人工智能技术的飞速发展,AI生成的短剧时代似乎已近在咫尺。近期,各种视频生成AI的Demo展示出令人惊叹的创意,无论是光影效果的真实感,还是丰富的想象力,都让人赞叹不已。其中,快手旗下的大模型“可灵AI”(Kling)尤为引人注目,它在生成大幅度运动时保持了良好的稳定性和细节处理,例如生成的奔跑半人马视频。可灵AI不仅支持文生视频,还能够进行图生视频、视频续写和多尺寸选择,功能日益完善。 在世界人工智能大会WAIC 2024上,可灵AI再次升级,发布了高画质版、首尾帧控制和相机镜头控制等功能,提升了视频的质...

AI技术惊艳央视:通义实验室视频生成,让兵马俑与宝石老舅共演EMO Rap盛宴

在古老的黄土高原,秦腔的回响唤醒了沉睡千年的兵马俑,带来了一场震撼人心的表演。在《2024中国・AI 盛典》中,通过阿里巴巴通义实验室的尖端技术EMO,兵马俑与宝石Gem共同演绎了《从军行》,生动再现历史与现代的交融。这项技术不仅让北宋文豪苏轼“复活”,与李玉刚共唱《水调歌头》,更在社交媒体上引发热议,如“高启强化身罗翔普法”等热门话题。 EMO是AI领域的创新之作,只需照片和音频,就能创造逼真的唱演视频,精确匹配音频节奏。在通义APP上,用户可以亲自体验EMO的魅力,参与“全民舞台”创作。EMO的技术基础——弱控制...

ShareGPT4V团队与中科大&上海AI Lab联合发布:百万级高质量视频数据集ShareCaptioner-Video,颠覆性差分滑窗视频描述,登顶数据集排行榜

提升视频生成质量:ShareGPT4V团队发布大规模高质量视频数据集 中国科学技术大学和上海AI实验室合作的ShareGPT4V团队,近期推出了一项里程碑式的成果——全新的视频数据集,该数据集荣登HuggingFace排行榜首位。这个数据集包含了超过3000小时的高质量视频,每段视频均配以详尽的文字描述,旨在改善视频生成的质量。通过使用该数据集,团队重新评估了北京大学的Open-Sora-Plan,发现视频生成的性能显著增强。 研究者们强调,高质量的视频-字幕数据对视频理解和生成任务至关重要。他们利用GPT-4v的视觉能力,构建了4万条带有...
12