0 人感兴趣 · 1 次引用
无需对 vLLM 核心代码进行侵入式二次开发,就能让最新大模型在昆仑芯 XPU 上快速落地,真正实现即插即用。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名