创造历史：阿里通义开源模型Qwen2.5在Chatbot Arena上超越Llama，引领大语言模型潮流

近日，基准测试平台Chatbot Arena公布了最新的大模型盲测排行榜，阿里巴巴的通义千问开源模型 Qwen2.5再次成功跻身全球前十。具体而言，Qwen2.5-72B-Instruct在大语言模型（LLM）榜单中排名第10，成为唯一进入前十名的中国大模型。此外，Qwen系列中的视觉语言模型Qwen2-VL-72B-Instruct也在Vision榜单中排名第九，是当前得分最高的开源大模型。

与此同时，Qwen系列在全球开源社区中的影响力显著提升，基于Qwen系列的衍生模型数量已突破7.43万个，超过了Llama系列的7.28万个。这标志着通义千问Qwen已经成为世界上最大的生成式语言模型族群之一。在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上，Qwen系列及其衍生模型占据了前十名的所有位置。

Qwen2.5-72B-Instruct在Chatbot Arena的大语言模型榜单中排名第10。该平台由开放研究机构LMSYS Org推出，自2023年5月上线以来，一直是全球顶级大模型的重要竞技场。平台集成了70多个大模型，并通过匿名方式让用户进行盲测，最终根据用户的实际对话体验进行投票。Qwen2.5-72B-Instruct得分仅次于OpenAI的o1和GPT-4o等模型，成为中国表现最佳的大模型。

同样在9月19日发布的Qwen2-VL-72B-Instruct也迅速进入Vision榜单，排名第9，仅次于GPT-4o和Gemini-1.5-Pro等闭源模型，成为表现最好的开源视觉语言模型。此前，Qwen系列已有多个开源模型成功进入Chatbot Arena榜单。

Qwen2.5的发布引起了国内外开源社区的高度关注。这套开源模型包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型，几乎每个尺寸的模型都达到了业界最佳性能。发布仅10天内，下载量就超过了150万次。国外开发者称赞通义千问为真正的“开放AI”，有用户甚至发起话题：“大家都用Qwen2.5替换了哪些常用模型？”

本文来源：