写点什么

大型语言模型

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐

强化大型语言模型复杂指令推理能力的新方法

用户头像
qife
08-06

本文提出RAIF方法,通过可验证规则奖励机制和专家行为克隆技术,显著提升大型语言模型处理并行/链式/分支结构复杂指令的能力。1.5B参数模型性能提升11.74%,达到8B模型水平。

大型语言模型_大型语言模型技术文章_InfoQ写作社区