标签:Phi-3-mini
微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5
微软近日在其官网上开源了名为 Phi-3-mini 的小型语言模型,这是 Phi-3 系列的第一个模型,拥有38亿参数和丰富的训练数据。Phi-3-mini 在多项语言、推理、编码和数学基准测试中表现出色,超越了许多百亿参数规模的模型。该模型有两种上下文长度变体,经过预训练和指令调整,能更好地理解和执行各种指令。与大型语言模型相比,Phi-3-mini 更易于操作,适合在端侧部署和运行。微软表示,该模型的成本远低于类似功能的模型,例如可能是GPT-3.5成本的十分之一。Phi-3-mini 的出色性能得益于合成数据集的训练,该数据集由过滤的网...