标签:面壁智能
面壁智能推出开源MiniCPM3-4B AI模型:端侧ChatGPT时代正式到来
近日,面壁智能在其官方公众号上宣布推出了全新的开源 MiniCPM3-4B AI 模型,并称这一模型标志着“端侧 ChatGPT 时代”的到来。这款新模型在性能方面超越了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,甚至可以与拥有 70 亿至 90 亿参数的其他 AI 模型相媲美。 相比于前两代产品 MiniCPM1.0 和 MiniCPM2.0,MiniCPM3-4B 在功能和应用范围上有了显著提升。它不仅支持函数调用和代码解释器,还具备更大的词汇量和更长的最大处理长度。以下是三个版本的主要区别: - 词汇量:123K → 73K → 73K - 模型层数:40 → 52 → 62 - ...
面壁智能携手华为云,引领大模型人工智能:端云协同解决方案新篇章
在人工智能领域迎来新突破,面壁智能与华为云于6月22日宣布建立正式合作关系,共同推出大模型端云协同解决方案。这一合作旨在推动大模型在各种智能终端如手机、PC、智能家居和穿戴设备中的深度融合,并探索在电动汽车和具身智能等新兴领域的应用。同时,大模型也将被应用于传统行业,如金融、法律和政务服务,以提升效率。面壁智能,作为业界领先的大模型技术创新企业,致力于打造智能时代的大模型基础设施,促进模型的高效训练和广泛应用。 面壁智能的明星产品——'小钢炮' MiniCPM端侧模型系列,自2024年2月发布以来,凭借...
为什么斯坦福大学生要抄袭中国大模型?
斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...