北京大学

感谢IT之家网友有鲫雪狐和Autumn_Dream提供的线索。根据华为技术有限公司和北京大学高性能计算校级公共平台的最新消息,2025年3月9日,北京大学与华为联合发布了DeepSeek全栈开源推理方案。该方案基于北大自研的SCOW算力平台系统和鹤思调度系统,并整合了DeepSeek、openEuler、MindSpore与vLLM/RAY等社区开源组件,实现了在华为昇腾上的高效推理,并支持大规模算力集群训推一体化部署。所有开发者都可以获取源码并根据需求进行二次开发,性能接近闭源方案。

目前,此方案已在未名卓越一号集群成功部署。该集群由北京大学计算中心负责研制与运维管理,为北大鲲鹏昇腾科教创新卓越中心提供算力支持。作为国内首个基于高校自研基础软件的国产智算平台,该集群于2024年11月18日上线运行,首期集成20台昇腾AI服务器与10台鲲鹏通用服务器,AI算力规模达到30.64PFlops(半精度)。此次发布的DeepSeek推理方案依托全栈开源组件构建,在openEuler开源操作系统层面进行了深度优化;通过异构调度负载感知MoE冷热专家,实现更细粒度的任务调度;通过异构融合来高效管理内存,减小系统内存碎片;利用毕昇编译器进一步优化,减少算子下发耗时,提升推理整体性能。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...