标签:DeepSeek 研究团队在原有基础上进行了两项关键修改:延长阶段 I 的训练时间