0 人感兴趣 · 1 次引用
本文旨在阐明如何将 Mooncake Store 作为 RBG 编排下 SGLang PD 分离推理服务的补充角色,系统化实现生产级 KVCache 外置能力。
每天发掘好玩、好用的AI应用~
提供全面深入的云计算技术干货
InfoQ签约作者