李开复旗下 AI 公司零一万物宣布开源 Yi-9B 模型,号称同系列代码、数学能力最强

在AI领域,李开复领军的创新工场孕育出了一颗璀璨新星——“零一万物 01AI”。他们近期在其公众号上释出了强大的Yi-9B大模型,被誉为Yi系列的“理科状元”。这个模型以8.8B的参数量和4K tokens的默认上下文长度,展现了顶尖的代码和数学处理能力。在Yi-6B基础上,Yi-9B通过额外0.8T tokens的训练得到提升,直至2023年6月。

据官方介绍,Yi-9B在综合性能(Mean-All)上优于同类开源模型,包括DeepSeek-Coder、DeepSeek-Math等。在代码理解(Mean-Code)上,仅略逊于DeepSeek-Coder-7B,但超越了Yi-34B等其他模型。在数学解决(Mean-Math)上,仅次于DeepSeek-Math-7B。而在常识推理(Mean-Text)方面,它与Mistral-7B等保持在同一水平。

值得注意的是,Yi-9B的BF 16和Int8量化版本都可轻松部署在普通消费者级显卡上,降低了开发者的使用成本,更加友好。作为李开复创新工场的成果,该公司已先后开源了Yi-34B和Yi-6B,全力支持学术研究,并提供免费商用申请机会。对于关注AI进展的读者来说,这是一个不容忽视的里程碑。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...