字节跳动猛攻AI领域:大模型与豆包视频生成技术如何引领未来AI硬件潮流?

近日,大模型行业再次掀起了一场“价格战”,阿里云宣布旗下通义千问的多款商业化产品大幅降价。早在今年5月,大模型行业已经经历了一轮降幅近90%的价格战。在这场激烈的竞争中,最终能够存活的通用大模型可能不超过五个。对于字节跳动这家新兴的互联网大厂而言,其在大模型领域的布局相对较晚,但凭借“大力出奇迹”的拼劲,其AI智能助手“豆包”已成为国内用户最多的原生AI应用。

近日,字节跳动又带来了两大新动作:一是发布了一系列新的大模型,包括视频生成模型、音乐模型和同声传译模型;二是正在探索开发AI硬件,首款产品可能是智能耳机。从大模型B端的价格战,到C端的应用创新,再到生态系统的流量战,字节跳动在大模型行业中从未错过任何机会。那么,在大模型下半场的竞争中,字节手中还有哪些“好牌”?

视频生成赛道,字节后发而至

今年6月,快手推出了自研的视频生成大模型“可灵”;8月,字节跳动也发布了文生视频应用“即梦”。9月,字节跳动旗下的火山引擎发布了两款视频生成大模型:豆包视频生成-PixelDance和豆包视频生成-Seaweed。目前这两款模型已经在即梦AI内测版中进行小范围测试。

从目前的舆论来看,“即梦”在某些特定条件下表现更佳,而“可灵”在物体动态和光影方面更为自然。两种风格各有特色,但造成这种差异的原因不仅在于技术,还与快手和字节跳动各自的平台布局有关。快手在视频生成模型方面有先发优势,“可灵”得到了集团的全力支持,而字节跳动则在忙着进行大模型价格战。此外,字节跳动将“即梦”作为独立应用,而快手将其搭载在视频剪辑平台快影上,导致两者的用户积累和生成视频数量有所不同。

AI+硬件,字节布局流量通道

近日,字节跳动的另一新动作是探索AI硬件。据《晚点LatePost》报道,字节正在探索将大模型与硬件结合,首款产品可能是智能耳机。早在今年5月,《36氪》曾报道字节正在加速AI硬件方向的探索,并收购了耳机品牌Oladance。字节在硬件方面的探索经验丰富,早在2018年就收购了锤子科技,并发布了坚果手机、TNT显示器等产品。然而,办公硬件市场竞争激烈,字节转而聚焦教育硬件赛道,启动了“大力教育”品牌,并发布了智能学习灯、教育平板等产品。尽管字节投入巨资,但由于盲目跟风和政策影响,教育硬件并未取得成功。2021年,字节收购了VR厂商PICO,但同样遭遇挫折。不过,字节并未放弃,其豆包大模型已与多家硬件厂商展开合作,并与荣耀、OPPO等品牌达成合作。

“软硬件协同”已在互联网行业经历多次轮回,硬件是软件落地的载体,也是用户流量通向生态的通道。目前,各大模型厂商在AI硬件的布局仍有雷同之处,但有了连接物理世界的入口,才能形成完整的AI生态。字节的野心不仅在于硬件,还在于整合整个生态系统。字节推出的智能体开发平台“扣子”和AI编程助手“豆包MarsCode”将进一步提升其大模型能力和应用体验。

虎口夺食,字节也在整合生态

字节跳动的野心不仅限于硬件,还在于与阿里、百度等大厂争夺AI生态话语权。除了提升大模型能力、打磨AI应用和推出AI硬件,字节还推出了智能体开发平台“扣子”和AI编程助手“豆包MarsCode”。字节的业务场景涵盖了短视频、社交媒体、在线教育等多个领域,为其大模型的研发和训练提供了丰富的应用场景。字节更侧重于C端体验,先打磨C端产品,再拓展B端市场。流量是字节的优势,其旗下的抖音、今日头条等产品已成为重要流量入口,通过庞大的用户规模和精准的数据分析能力,字节进一步提升了大模型的使用体验。

然而,字节在B端市场面临阿里云、腾讯云等强劲对手,需要找到新的突破口。字节希望通过硬件拓展教育、办公等垂直赛道,找到新的增长点。未来,字节需要成为更专业的大模型解决方案提供商,才能实现弯道超车。

本文来源: ​伯虎财经公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...