标签:AI模型训练

30 亿参数“从 0 到 1”,摩尔线程 / 无问芯穹“千卡集群”行业内首次实现国产 GPU 端到端 AI 大模型实训

摩尔线程与无问芯穹近期共同宣布,成功运用国产全功能GPU千卡集群完成了大规模AI模型“MT-infini-3B”的训练。该模型基于摩尔线程的MTT S4000 GPU和无问芯穹的AIStudio PaaS平台构建,展现了极高的稳定性和扩展效率。训练过程耗时13.2天,未出现任何中断,集群训练稳定性达100%,标志着国产GPU在大模型训练领域的可靠性和创新合作模式的开启。MT-infini-3B模型在同类规模中表现出色,于C-Eval、MMLU、CMMLU等评估指标上超越了国际主流硬件训练的模型。无问芯穹CEO夏立雪透露,公司正致力于构建“M x N”中间层产品,以实现多模型...