国产大模型 Yi-Lightning 在大模型竞技场崭露头角,零一万物与李开复共创新辉煌

近日,国产大模型在国际舞台上取得了令人瞩目的成就。在最新的大模型竞技场(Chatbot Arena)榜单中,国产大模型首次超越了GPT-4o,标志着中国在人工智能领域的显著进步。

零一万物作为“大模型六小强”之一,发布了其最新旗舰模型Yi-Lightning(闪电)。这款模型在多项测试中表现出色,不仅在总榜单上位列第六,在数学分榜上更是与GPT-4o-2024-05-13等顶级模型并驾齐驱。此外,Yi-Lightning在代码和其他分榜上也名列前茅,整体表现几乎与马斯克的最新xAI大模型Grok-2-08-13持平。

与此同时,清华大学旗下的智谱AI也推出了其新款大模型GLM-4-Plus,并成功进入总榜第九名。这一成绩是基于全球数百万用户的盲测投票得出的。值得一提的是,大模型竞技场最近更新了评分规则,降低了对AI回答长度和风格的权重,更加侧重于模型解决实际问题的能力。

在具体能力方面,Yi-Lightning和GLM-4-Plus在中文能力上均表现优异,分别位列第二和第三。特别是在数学和代码能力上,Yi-Lightning分别获得了第三和第四的好成绩。此外,Yi-Lightning在Hard Prompts和Longer Query分榜上也稳居第四。

发布会现场,零一万物的创始人兼CEO李开复博士详细介绍了Yi-Lightning的技术优势。这款模型采用了MoE混合专家模型架构,通过优化混合注意力机制(Hybrid Attention)和引入跨层注意力(Cross-Layer Attention, CLA),大幅提升了推理速度和生成质量。Yi-Lightning在翻译文学作品时不仅速度快,用词也更为精准。

Yi-Lightning还采用了动态Top-P路由机制,能够在训练过程中激活所有专家网络,而在推理阶段根据任务难度选择最适合的专家网络。此外,李开复博士强调,零一万物不会放弃预训练,并在训练过程中积累了丰富的多阶段训练方法,确保模型既能学习广泛的知识,又能专注于高质量的。

除了发布新模型外,零一万物还推出了AI2.0数字人方案,该方案已接入Yi-Lightning,实现了更自然的实时互动效果。在谈及与国外顶尖大模型的差距时,李开复博士表示,虽然追赶美国最顶尖的模型仍需付出巨大努力,但这次Yi-Lightning的成绩证明了国产大模型与硅谷顶级模型的差距已缩小至五个月。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...