EPLB
0 人感兴趣 · 1 次引用
- 最新
- 推荐

DeepSeek 开源周 “王炸”:DualPipe 与 EPLB,榨干芯片算力的秘密武器
DeepSeek 开源 DualPipe 和 EPLB 项目,助力提升模型训练效率。DualPipe 通过重叠前后向计算通信,减少流水线气泡;EPLB 采用冗余专家策略平衡 GPU 负载。二者协同,大幅提高训练速度,充分利用芯片算力。
0 人感兴趣 · 1 次引用
DeepSeek 开源 DualPipe 和 EPLB 项目,助力提升模型训练效率。DualPipe 通过重叠前后向计算通信,减少流水线气泡;EPLB 采用冗余专家策略平衡 GPU 负载。二者协同,大幅提高训练速度,充分利用芯片算力。