标签：面壁智能

面壁智能推出开源MiniCPM3-4B AI模型：端侧ChatGPT时代正式到来

近日，面壁智能在其官方公众号上宣布推出了全新的开源 MiniCPM3-4B AI 模型，并称这一模型标志着“端侧 ChatGPT 时代”的到来。这款新模型在性能方面超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125，甚至可以与拥有 70 亿至 90 亿参数的其他 AI 模型相媲美。相比于前两代产品 MiniCPM1.0 和 MiniCPM2.0，MiniCPM3-4B 在功能和应用范围上有了显著提升。它不仅支持函数调用和代码解释器，还具备更大的词汇量和更长的最大处理长度。以下是三个版本的主要区别： - 词汇量：123K → 73K → 73K - 模型层数：40 → 52 → 62 - ...

来源：

IT之家【阅读原文】
Tags：AI 模型 ChatGPT MiniCPM3-4B 开源面壁智能

7个月前

面壁智能携手华为云，引领大模型人工智能：端云协同解决方案新篇章

在人工智能领域迎来新突破，面壁智能与华为云于6月22日宣布建立正式合作关系，共同推出大模型端云协同解决方案。这一合作旨在推动大模型在各种智能终端如手机、PC、智能家居和穿戴设备中的深度融合，并探索在电动汽车和具身智能等新兴领域的应用。同时，大模型也将被应用于传统行业，如金融、法律和政务服务，以提升效率。面壁智能，作为业界领先的大模型技术创新企业，致力于打造智能时代的大模型基础设施，促进模型的高效训练和广泛应用。面壁智能的明星产品——'小钢炮' MiniCPM端侧模型系列，自2024年2月发布以来，凭借...

来源：

站长之家【阅读原文】
Tags：人工智能华为云大模型端云协同面壁智能

9个月前

为什么斯坦福大学生要抄袭中国大模型？

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似，后者在5月中旬发布。尽管模型开源允许二次开发，但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实，他们的模型曾用于识别战国古文字，而斯坦福团队的模型不仅识别出了同样的文字，连错误也一致，坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学，都在全球AI领域具有重要地位。斯坦福团队成员已道歉，指出是由于团队内一人为了快速成名而...

来源：

吴晓波频道公众号【阅读原文】
Tags：AI模型开源抄袭斯坦福大学面壁智能

10个月前