2024年被誉为“AI应用元年”,字节跳动在AI领域的布局显著加速。过去一年,字节推出了十多款AI应用,涵盖了Agent定制、聊天、社交、图像/视频、办公、教育等多个领域,甚至涉足了硬件产品。在移动互联网时代,字节跳动因其“APP工厂”之称而闻名,成功打造了今日头条和抖音两大爆款产品,成为最赚钱的中国互联网公司之一。
大模型时代,字节跳动希望创造新的增长奇迹,寻找下一个超级应用。这一目标不仅属于字节,许多发力大模型的公司也是如此。在今年5月的一次行业大会上,小冰公司CEO李笛表示,当前AI的商业价值已从单纯的技术输出转变为通过高附加值产品实现收益。此前,朱啸虎在接受腾讯新闻采访时也提到,他看好能够立即商业化的AGI(通用人工智能)应用,但不确定大模型何时会引爆to C应用。他认为,to C应用必须刚需、高频,才能长期保持竞争力。
在争夺AI时代的船票方面,字节跳动显然意识到了这一点。过去一年,Chatbot、AI虚拟社交、AI Agent成为AI圈的三大热点领域,字节跳动无一遗漏。例如,其智能对话产品豆包对标ChatGPT和Kimi;AI虚拟角色聊天互动社交应用“猫箱”(原“话炉”);以及AI Bot开发平台扣子(Coze),对标OpenAI的GPT Store。
字节跳动通过内部赛马机制,短时间内快速推出产品,再经过市场检验,优胜劣汰。这种做法在移动互联网时代已经证明了其有效性。据统计,2018-2020年,字节跳动自研/收购了大量项目,在App Store上线的应用约140个。豆包作为用户规模最大的AI应用之一,承载着字节在AI时代的雄心,旨在打造类似今日头条、抖音这样的爆款、国民级应用。
QuestMobile数据显示,截至今年7月,AI原生应用的月活用户规模已突破6630万,其中豆包以3042万的月活用户规模位居榜首,远超百度的文小言。字节跳动在抖音平台上大力推广豆包,几乎屏蔽了同类型产品的投放,将海量用户转化为自家产品的用户。
此外,字节跳动还基于现有产品孵化了一些新的应用,如即梦。作为全球最大的短视频平台,字节跳动CEO梁汝波曾警告,AI技术将对创作带来巨大颠覆,甚至可能产生新的创作平台。如果中国版Sora出自其他平台,抖音可能会失去视频创作入口。因此,即梦的推出旨在应对这一挑战。然而,截至今年10月15日,即梦AI的累计下载量仅为79.14万,距离被用户广泛接受还有很长的路要走。
大模型时代,视频行业的格局可能发生重大变化。字节跳动通过豆包和即梦这两张王牌,迅速在AI时代打出自己的牌。豆包是一款纯粹的AI原生应用,而即梦则是基于现有核心业务的进化迭代,两者都在争取AI时代的船票。
除了豆包和即梦,字节跳动在AI应用领域进行了广泛的布局。从底层模型层到中间的性能优化匹配层,再到最终的C端应用层,字节跳动全面覆盖。据统计,从去年8月至今,字节跳动在AI领域共推出了9款大模型、2个智能体开发平台和十余个AI应用。9月份,字节还推出了首款AI硬件产品——AI智能体耳机Ola Friend,尝试在硬件市场找到AI落地的新入口。
根据非凡资本旗下商业数字化及创新研究中心“非凡产研”的数据榜单,字节跳动是国内目前AI产品数量最多的企业之一。与百度相比,字节跳动更多集中在市场热门领域的高频使用场景,如图片/视频生成、聊天、社交、办公、教育、音乐等领域。今年以来,字节更新或上线了扣子、猫箱、星绘、河马爱学等8款AI应用产品,主要在上半年推出。
值得注意的是,这些产品并非仅由一个团队开发,除了专注于应用层的AI创新业务部门Flow,剪映、今日头条、大力教育、巨量引擎等业务部门也在发力AI。这些团队推出的产品分别聚焦于图像/视频、办公、教育、电商创作等领域。此外,字节跳动还注重海内外同步布局,如国内的豆包对应海外的cici,国内的扣子对应海外的Coze,国内的猫箱对应海外的BagelBell。
字节跳动还试图在C端和B端市场通吃。例如,扣子既面向C端用户,也面向B端开发者。Agent(智能体)是另一个被广泛讨论的概念,业内普遍认为,Agent是AI与具体应用场景结合落地的一种方式,大模型需要Agent来实现功能的扩展。扣子是目前Agent应用开发平台中用户规模最高、品牌热度最大的产品。
尽管存在一些问题,但大厂仍然热情高涨地推出Agent开发平台。百度智能云千帆APPBuilder于2023年10月17日推出,是上线时间最早的产品,百度今年二季度财报数据显示,App Builder构建应用量达数十万。腾讯元器于今年5月上线,但目前尚未公布用户规模,不过用户创建的智能体可以一键分发至QQ、微信客服、微信公众号等腾讯全域。
字节跳动在布局应用的同时,豆包大模型也在快速更新。2023年8月,字节自研推出了一款大规模预训练语言模型——云雀大模型,定位于自然语言生成和理解的AI大模型。7个月后,云雀大模型升级为豆包大模型家族,并一口气发布了9个豆包模型。字节大模型每两个月更新一次。今年5月,字节火山引擎一口气推出9款豆包大模型家族,两个月后又发布了豆包·图生图模型;再到今年9月,推出了PixelDance和Seaweed两款豆包·视频生成模型。截至目前,豆包模型家族已经集齐了文本、语音、图片、音乐、视频等共计13款模型。
火山引擎总裁谭待在接受虎嗅采访时提到,字节的模型在不断进化,一旦进化到某个层次,就可以在上面做应用。字节的两款顶级AI原生应用——扣子和豆包,都是基于豆包大模型。谭待还解释了字节对外发布豆包大模型较晚的原因:“因为豆包达到了可以广泛应用于各种场景的程度,只有越来越多的人使用它,才能驱动技术进步,形成正循环。”
最近,硅星人引用字节内部人士的话解释豆包大模型:“现在的豆包更像是一个统一的出口,连接用户。豆包产品后端连接了多个模型测试,是一个训练场,通过API的结果反馈来评测模型效果,但一时难以做出取舍。”
定位为字节跳动ToB云平台的“火山引擎”,肩负着字节在B端市场数字化落地的重任。随着AI大模型的出现,“云服务+大模型”成为云服务市场转型的重点。目前,火山引擎已经形成了云基础设施、豆包大模型和火山方舟2.0的一套产品体系,帮助企业在AI转型中受益,同时也为内部提供支持。
谭待此前表示,火山引擎自己不做大模型,而是首先服务好国内做大模型创业的公司。火山引擎的任务是提供算力供给和搭建云原生机器学习平台,帮助企业高效应用算力,进一步提升效率,使大模型训练得又快又稳。
在AI大模型应用的浪潮中,字节跳动不仅要完成商业落地,还要努力成为“中国OpenAI”。底层能力的搭建至关重要。上个月,谭待解释了为何此时才发布视频模型:“模型是影响未来十年、二十年的长远东西。”AI计算正在加速渗入各行各业,一场看不见的革命也许就在不久的未来。但同时,字节跳动在AI时代的野心也需要在物理世界中得到验证。种一棵树,最好的时机首先是在十年前,其次是当下。
本文来源: 新莓daybreak公众号【阅读原文】