马斯克旗下xAI收购视频生成模型初创公司Hotshot,仅4人团队13个月打造类Sora的强大AI工具,引领未来内容创作潮流

(由多段落组成)

马斯克在视频生成领域迈出了重要一步,xAI团队收购了一家专注于视频生成的初创公司。这家仅有4人的团队,在短短13个月内成功开发出类似于Sora的模型,并推出了名为Hotshot的产品。这一举动引发了广泛关注。

根据官方公告,Hotshot已经开发了三款基础视频生成模型。然而,在被收购后,Hotshot停止了新功能的发布,并设定了用户下载过往创作视频的截止日期为3月30日。这引起了网友们的热议,许多人回想起马斯克在今年初的一次直播中提到的计划:几个月内推出Grok视频模型。

随着Hotshot联创兼CEO宣布这一消息,马斯克随即在社交媒体上表示:“酷炫的视频AI即将来临!” 这一表态进一步提升了外界对这款产品的期待值。同时,网友们也纷纷祝贺Hotshot团队的成功。

那么,是什么让马斯克对Hotshot如此感兴趣?答案在于两个关键点:第一,尽管团队规模小,但效率极高。Hotshot团队仅4人,却在不到两年的时间内连续训练出了3个视频生成模型,并获得了一定的市场关注;第二,其投资者阵容强大,包括Reddit联合创始人Alexis Ohanian等知名人士。

Hotshot的核心产品“Sora”模型是由这4人团队共同打造的。团队中的两位联合创始人Aakash Sastry和John Mullan早在2012年就相识。两人最初分别致力于视频聊天应用和视觉通讯应用的开发,但由于市场需求的变化,他们决定转向创造一个让人们在网上表达自己时感到舒适和自由的环境。

2017年,两人创立了Natural Synthetics公司,开始探索社交应用的多种可能性。直到2023年1月,Hotshot正式上线iOS应用商店。起初,Hotshot专注于图片生成,基于开源模型Stable Diffusion为用户提供免费服务。随后,团队逐渐将注意力转向视频生成,并意识到需要自主研发底层模型以实现更好的用户体验。

在过去13个月中,Hotshot团队开发了三个不同的视频生成模型:

– Hotshot-XL:耗时3个月完成,每秒可生成8帧视频,开源后每月吸引约2万名开发者和艺术家使用。
– Hotshot Act-One:耗时5个月完成,生成3秒、8fps的视频,基于2亿个公开视频数据训练而成。
– Hotshot:耗时4个月完成,生成最长10秒的720p视频,专注于文本到视频的生成。

根据用户反馈,在各种提示评估中,Hotshot的表现优于其他开源文生视频模型,用户满意度高达70%。

此外,Hotshot的投资方包括Stripe前高管Lachy Groom、Reddit联合创始人Alexis Ohanian以及SV Angel等风险投资机构。具体融资细节尚未披露,也不清楚整个团队是否会完全加入xAI。

马斯克为何选择自研视频生成模型?实际上,早在今年初的一场直播活动中,他就表达了对Grok模型缺乏视频生成功能的不满。解决这一问题通常有两种途径:接入第三方模型或自主研发。此前,Grok系列更多依赖于第一种方案,例如Grok-2的文生图功能通过与Flux深度合作实现。然而,为了与OpenAI、谷歌等巨头展开长期竞争,xAI最终选择了自主研发的道路。

对于普通用户而言,无论采用何种方式,大家的关注点都集中在Grok视频生成功能的未来表现上。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...