自动评估
0 人感兴趣 · 1 次引用
- 最新
- 推荐
多智能体评估框架 MAJ-EVAL:实现 LLM 自动评估与人类多维度评价对齐
本文提出MAJ-EVAL框架,通过自动构建多维度评估者角色并组织群体辩论,使基于LLM的自动评估结果更贴近人类专家评价,解决了现有方法中角色设计随意和泛化性不足的问题。
0 人感兴趣 · 1 次引用
本文提出MAJ-EVAL框架,通过自动构建多维度评估者角色并组织群体辩论,使基于LLM的自动评估结果更贴近人类专家评价,解决了现有方法中角色设计随意和泛化性不足的问题。