0 人感兴趣 · 1 次引用
本地化方案里,满血版 R1 的成本太高了,国产显卡问题更显著,由于不支持 BF8,硬上满血版的代价过于高昂。QwQ-32B可能更有利于本地化部署的思维链能力普及——牺牲一些模型能力换取更大规模的应用落地。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名