并行策略
0 人感兴趣 · 2 次引用
- 最新
- 推荐
DeepSeek-V3.2 128K 推理秒开?百度百舸开源 CP 上下文并行方案
DeepSeek V3.2 的 DSA 架构是算法效率的创新探索,而 CP 方案则是其在长文本场景下必不可少的 AI Infra 协同组件。DSA 通过动态稀疏机制降低了整体计算量,CP 使多卡能协同、均衡地分摊显存与计算负载,从而实现长文本的 TTFT 显著降低。
基于 veRL 多模态混训的视频上下文并行,百度百舸提升具身智能强化学习效能
在客户场景的实际测试中,百度百舸的方案经过合理的切分配置,单段视频支持的帧数上限提升超过 2 倍,单帧最大分辨率上限提升超过 2.6 倍,可以大幅缩短训练时间。同时显存占用更低,训练曲线更加平稳。在模型效果上,在既有评测集上的准确率评分提升约 5%。






