Meta AI发布开源人工智能Llama 4：首次引入混合专家架构，推动多模态模型发展

当地时间上周六（4月5日），美国科技巨头Meta正式推出了其迄今为止最先进的开源人工智能模型——Llama 4。该系列模型包括两个版本，分别命名为Scout和Maverick。据Meta介绍，Llama 4是一款多模态大模型，能够高效处理并整合多种类型的数据，如文本、视频、图像和音频，并支持在不同格式间进行转换。

值得一提的是，Llama 4首次采用了混合专家（MoE）架构，这种创新设计显著提升了模型在训练和响应用户查询时的效率。通过将模型划分为多个专注于特定任务的“专家”子模型，Llama 4能够更精准地完成复杂任务。根据官方数据，Scout拥有170亿个活跃参数、16个“专家”模型以及1090亿个总参数；而Maverick同样具备170亿个活跃参数，但其“专家”模型数量达到了128个，总参数量更是高达4000亿。

除了Scout和Maverick，Meta还在积极研发一款名为Behemoth的更强大模型，被称作“世界上最智能的大模型之一”，同时也是新模型中的“教师”。所有这些模型均基于“大量未标注的文本、图像和视频数据”进行了训练，从而获得了广泛的视觉理解能力。

目前，Scout和Maverick已公开发布于Llama.com网站及Meta的合作伙伴平台，同时也可以通过WhatsApp、Messenger和Instagram Direct获取。Meta宣布，其人工智能助手Meta AI已在40个国家更新为使用Llama 4模型。不过，多模态功能暂时仅在美国以英语提供。

Meta首席执行官马克·扎克伯格在周六的讲话中表示：“我们的目标是打造世界领先的人工智能系统，并将其开源化，使其广泛可用，从而让全球每个人都能从中受益。”他还提到，“我一直认为开源人工智能将成为主流趋势，随着Llama 4的推出，这一愿景已经开始实现。今天，Meta AI经历了一次重大升级。”

此外，Meta首席产品官Chris Cox上个月曾透露，Llama 4的推出将赋予AI代理更高的推理能力和行动力。然而，Llama 4的研发过程并非一帆风顺。据知情人士爆料，Llama 3推出一年后，Llama 4迟迟未能面世的主要原因在于，该模型在技术基准测试中未能达到Meta的预期，特别是在推理和数学任务方面表现欠佳。同时，Meta也担心其模型在模拟人类对话方面不如OpenAI的竞品。

为了进一步巩固其在人工智能领域的领先地位，Meta计划今年投入高达650亿美元用于扩展其人工智能基础设施。然而，投资者正向大型科技公司施压，要求它们证明这些巨额投资的实际回报。

本文来源：