0 人感兴趣 · 1 次引用
KwaiCoder-23BA4-v1 是快手Kwaipilot 团队最新开源的自研代码续写大模型,模型的训练依托于 Kwaipilot 团队提出的一种高效的模型训练方案。通过结合模型剪枝、知识蒸馏、细粒度合并等技术,相比传统方法以1/30的成本完成了23B 宽MoE架构代码续写模型的训练,
一个日语专业的程序猿。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名
专注分享阿里技术的丰富实践和前沿创新。