模型评测
0 人感兴趣 · 2 次引用
- 最新
- 推荐
如何用大模型评估大模型——PAI-Judge 裁判员大语言模型的实现简介
阿里云人工智能平台 PAI 推出 PAI-Judge 裁判员大模型,为用户构建符合应用场景的多维度、细粒度的评测体系,支持单模型评测和双模型竞技两种模式,允许用户自定义参数,实现准确、灵活、高效的模型自动化评测,为模型迭代优化提供数据支撑。
PAI 大语言模型评测平台现已支持裁判员模型评测
本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,无代码评价开源模型或者微调后模型的性能,并通过不同模型间性能对比,选择符合自己场景的模型。