Meta AI发布开源人工智能Llama 4:首次引入混合专家架构,推动多模态模型发展

当地时间上周六(4月5日),美国科技巨头Meta正式推出了其迄今为止最先进的开源人工智能模型——Llama 4。该系列模型包括两个版本,分别命名为Scout和Maverick。据Meta介绍,Llama 4是一款多模态大模型,能够高效处理并整合多种类型的数据,如文本、视频、图像和音频,并支持在不同格式间进行转换。

值得一提的是,Llama 4首次采用了混合专家(MoE)架构,这种创新设计显著提升了模型在训练和响应用户查询时的效率。通过将模型划分为多个专注于特定任务的“专家”子模型,Llama 4能够更精准地完成复杂任务。根据官方数据,Scout拥有170亿个活跃参数、16个“专家”模型以及1090亿个总参数;而Maverick同样具备170亿个活跃参数,但其“专家”模型数量达到了128个,总参数量更是高达4000亿。

除了Scout和Maverick,Meta还在积极研发一款名为Behemoth的更强大模型,被称作“世界上最智能的大模型之一”,同时也是新模型中的“教师”。所有这些模型均基于“大量未标注的文本、图像和视频数据”进行了训练,从而获得了广泛的视觉理解能力。

目前,Scout和Maverick已公开发布于Llama.com网站及Meta的合作伙伴平台,同时也可以通过WhatsApp、Messenger和Instagram Direct获取。Meta宣布,其人工智能助手Meta AI已在40个国家更新为使用Llama 4模型。不过,多模态功能暂时仅在美国以英语提供。

Meta首席执行官马克·扎克伯格在周六的讲话中表示:“我们的目标是打造世界领先的人工智能系统,并将其开源化,使其广泛可用,从而让全球每个人都能从中受益。”他还提到,“我一直认为开源人工智能将成为主流趋势,随着Llama 4的推出,这一愿景已经开始实现。今天,Meta AI经历了一次重大升级。”

此外,Meta首席产品官Chris Cox上个月曾透露,Llama 4的推出将赋予AI代理更高的推理能力和行动力。然而,Llama 4的研发过程并非一帆风顺。据知情人士爆料,Llama 3推出一年后,Llama 4迟迟未能面世的主要原因在于,该模型在技术基准测试中未能达到Meta的预期,特别是在推理和数学任务方面表现欠佳。同时,Meta也担心其模型在模拟人类对话方面不如OpenAI的竞品。

为了进一步巩固其在人工智能领域的领先地位,Meta计划今年投入高达650亿美元用于扩展其人工智能基础设施。然而,投资者正向大型科技公司施压,要求它们证明这些巨额投资的实际回报。

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...