写点什么

自我评估

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐

语言模型的后完成学习技术解析

用户头像
qife
07-31

本文提出后完成学习(PCL)框架,通过利用模型输出完成后的序列空间,增强语言模型的推理与自我评估能力。实验表明该方法在传统监督微调和强化学习方法基础上实现了稳定提升。

自我评估_自我评估技术文章_InfoQ写作社区