DistilQwen2.5
0 人感兴趣 · 2 次引用
- 最新
- 推荐
DistilQwen2.5-R1 发布:知识蒸馏助推小模型深度思考
文章介绍了DistilQwen2.5-R1系列模型的开发与性能评估。通过知识蒸馏技术,该系列模型成功将大规模深度推理模型的知识迁移到小模型中,显著提升了计算效率和部署灵活性。
DistilQwen2.5 蒸馏小模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践
DistilQwen2.5是阿里云人工智能平台PAI推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路,DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始Qwen2.5模型有明显效果提升。