Mistral Large 2: 1230亿参数打造GPT-4级别AI模型,支持80多种语言与多语言编程,强化代码生成及数学推理能力

随着人工智能领域的竞争愈发激烈,各家公司纷纷推出了自己的最新技术成果。继Meta公司发布了开源的Llama 3.1模型后,法国的人工智能初创企业Mistral也不甘示弱,推出了其最新的旗舰级模型——Mistral Large 2

新一代模型亮点

Mistral Large 2拥有1230亿个参数,相较于前代产品,在代码生成、数学计算及逻辑推理等方面表现出更强的能力。此外,该模型还提供了更为出色的多语言支持与高级函数调用功能。它具备128k的上下文窗口,能够支持包括中文在内的多种语言以及超过80种编程语言。在MMLU上的测试结果显示,Mistral Large 2的准确率高达84.0%,在代码生成、逻辑推理和多语言支持方面均有显著提升。

减少幻觉问题

Mistral公司在训练过程中特别注重解决模型的“幻觉”问题,即模型在不知道答案的情况下也会给出看似合理的回答。通过训练,Mistral Large 2学会了在不确定时明确表达自己的无知,而不是编造答案。

开放授权策略

据IT之家报道,Mistral Large 2的一个重要特点在于其“授权开放”的策略,允许非商业研究使用,包括开放权重及支持第三方根据需求进行微调等。对于商业用户而言,则需与Mistral公司签订单独的许可协议才能使用。

性能对比

尽管Mistral Large 2的参数量仅为1230亿,不及Llama 3.1的4050亿,但在实际表现上却十分接近。这款基于原版Large模型的新产品不仅增强了多语言处理能力,还在推理、代码生成和数学运算方面取得了进步。Mistral宣称其为GPT-4级别的模型,在多项基准测试中与GPT-4o、Llama 3.1-405和Anthropic的Claude 3.5 Sonnet的表现相近。

Mistral Large 2可在其官方网站上使用,也能通过云服务合作伙伴获取。Mistral公司强调,他们将持续推动成本效益、速度和性能的发展,同时为用户提供更多创新功能,助力开发高性能的人工智能应用程序。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...