标签:NVLink

刚刚,DeepSeek在开源周重磅发布MoE模型训练与推理EP通信库DeepEP,全面支持NVLink,真是太Open了!

DeepSeek 开源周推出高效通信库 DeepEP,推动 MoE 模型训练与推理创新 上周五,DeepSeek 宣布本周为开源周(OpenSourceWeek),并计划连续发布五个软件库。昨天,他们开源了第一个代码库——FlashMLA,这是一款专为 Hopper GPU 设计的高效 MLA 解码核,仅用 24 小时就获得了近 8,000 个 Star(详情请参见《刚刚,DeepSeek 开源 FlashMLA,推理加速核心技术,Star 量飞涨中》)。今天,DeepSeek 继续开源底层架构的创新,发布了首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP。 在分布式系统中,如多 GPU 训练环境,处理单...