写点什么

自动评估

0 人感兴趣 · 1 次引用

  • 最新
  • 推荐

多智能体评估框架 MAJ-EVAL:实现 LLM 自动评估与人类多维度评价对齐

用户头像
qife
08-07

本文提出MAJ-EVAL框架,通过自动构建多维度评估者角色并组织群体辩论,使基于LLM的自动评估结果更贴近人类专家评价,解决了现有方法中角色设计随意和泛化性不足的问题。

自动评估_自动评估技术文章_InfoQ写作社区