近日,基准测试平台Chatbot Arena公布了最新的大模型盲测排行榜,阿里巴巴的通义千问开源模型Qwen2.5再次成功跻身全球前十。具体而言,Qwen2.5-72B-Instruct在大语言模型(LLM)榜单中排名第10,成为唯一进入前十名的中国大模型。此外,Qwen系列中的视觉语言模型Qwen2-VL-72B-Instruct也在Vision榜单中排名第九,是当前得分最高的开源大模型。
与此同时,Qwen系列在全球开源社区中的影响力显著提升,基于Qwen系列的衍生模型数量已突破7.43万个,超过了Llama系列的7.28万个。这标志着通义千问Qwen已经成为世界上最大的生成式语言模型族群之一。在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型占据了前十名的所有位置。
Qwen2.5-72B-Instruct在Chatbot Arena的大语言模型榜单中排名第10。该平台由开放研究机构LMSYS Org推出,自2023年5月上线以来,一直是全球顶级大模型的重要竞技场。平台集成了70多个大模型,并通过匿名方式让用户进行盲测,最终根据用户的实际对话体验进行投票。Qwen2.5-72B-Instruct得分仅次于OpenAI的o1和GPT-4o等模型,成为中国表现最佳的大模型。
同样在9月19日发布的Qwen2-VL-72B-Instruct也迅速进入Vision榜单,排名第9,仅次于GPT-4o和Gemini-1.5-Pro等闭源模型,成为表现最好的开源视觉语言模型。此前,Qwen系列已有多个开源模型成功进入Chatbot Arena榜单。
Qwen2.5的发布引起了国内外开源社区的高度关注。这套开源模型包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎每个尺寸的模型都达到了业界最佳性能。发布仅10天内,下载量就超过了150万次。国外开发者称赞通义千问为真正的“开放AI”,有用户甚至发起话题:“大家都用Qwen2.5替换了哪些常用模型?”
本文来源: 量子位【阅读原文】