0 人感兴趣 · 1 次引用
Mooncake 项目与 SGLang、vLLM 等主流大模型推理框架实现合作和适配,这些开源大模型推理框架可以通过使用 Mooncake 发布的 whl 包,支持 pip安装,docker 镜像部署等,实现了 PD 分离框架,极大提升了模型推理效率。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名