写点什么

LLM-as-a-Judge

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/8a/8a19f10310c185144b892685a6969123.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

[Paper Reading]: Self-Improving Alignment with LLM-as-a-Meta-Judge

用户头像
吴京
08-07

Meta 提出了一个新方法,使用self-improvement 的方法提升模型的 Judgement 和 Instruction Following 的能力。

LLM-as-a-Judge_LLM-as-a-Judge技术文章_InfoQ写作社区