标签:LiveBench AI
阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一
在人工智能领域,一项新的评测基准——LiveBench AI近日由图灵奖得主杨立昆及其合作机构推出,该基准对全球顶尖的开闭源大模型进行了评估。在首次发布的测评榜单上,阿里云通义千问的开源大模型Qwen2-72B脱颖而出,成为全球第一的开源大模型,且是中国唯一进入前十的模型,超越了Meta的Llama3-70B。GPT-4o虽然位居榜首,但Qwen2-72B作为开源模型的优异表现备受瞩目。 LiveBench AI的测评覆盖了34个领先模型,Qwen系列共有7款模型上榜,显示出强大的整体实力。除了Qwen2-72B外,还包括Qwen1.5的多个版本,它们是除GPT系列之外...