近日,面壁智能在其官方公众号上宣布推出了全新的开源 MiniCPM3-4B AI 模型,并称这一模型标志着“端侧 ChatGPT 时代”的到来。这款新模型在性能方面超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,甚至可以与拥有 70 亿至 90 亿参数的其他 AI 模型相媲美。
相比于前两代产品 MiniCPM1.0 和 MiniCPM2.0,MiniCPM3-4B 在功能和应用范围上有了显著提升。它不仅支持函数调用和代码解释器,还具备更大的词汇量和更长的最大处理长度。以下是三个版本的主要区别:
– 词汇量:123K → 73K → 73K
– 模型层数:40 → 52 → 62
– 隐藏层节点数:2304 → 1536 → 2560
– 最大处理长度:4k → 4k → 32k
– 系统提示词支持:不支持 → 不支持 → 支持
– 工具调用和代码解释器支持:不支持 → 不支持 → 支持
此外,MiniCPM3-4B 还具备一个 32k 的上下文窗口,通过 LLMxMapReduce 技术,能够在较低内存条件下处理无限上下文数据。
为了进一步丰富应用场景,面壁智能还推出了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,以及专门针对 RAG 场景的微调版 MiniCPM3-RAG-LoRA 模型。这些新工具将进一步提升模型在实际应用中的表现。
本文来源: IT之家【阅读原文】© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...