0 人感兴趣 · 1 次引用
本文提出后完成学习(PCL)框架,通过利用模型输出完成后的序列空间,增强语言模型的推理与自我评估能力。实验表明该方法在传统监督微调和强化学习方法基础上实现了稳定提升。
每天发掘好玩、好用的AI应用~
提供全面深入的云计算技术干货
InfoQ签约作者