写点什么

DSA

0 人感兴趣 · 3 次引用

  • 最新
  • 推荐

突破显存瓶颈:基于 DeepSeek-V3.2-Exp 的 Latent Cache 卸载预取方案设计与模拟验证

针对超长上下文场景的测试结果表明,在 MTP = 2 且上下文长度为 128K 的条件下,百度百舸的 Offload-Prefetch 机制能直接带来高达 123% 的吞吐提升。

https://static001.geekbang.org/infoq/f3/f37b12c1bbbe0392c790356993aae3f6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

DeepSeek-V3.2 的 DSA 稀疏注意力技术:在 TPU 平台上的效能革命与适配实践

DeepSeek最新发布DeepSeek-V3.2-Exp模型引入DSA稀疏注意力机制,实现长文本训练和推理效率的大幅提升。本文将深度解析技术原理,并重点探讨中昊心英「刹那@」TPU取得的显著收益与适配成果。

DSA_DSA技术文章_InfoQ写作社区