0 人感兴趣 · 1 次引用
无需对 vLLM 核心代码进行侵入式二次开发,就能让最新大模型在昆仑芯 XPU 上快速落地,真正实现即插即用。
每天发掘好玩、好用的AI应用~
提供全面深入的云计算技术干货
InfoQ签约作者