写点什么

模型评测

0 人感兴趣 · 2 次引用

  • 最新
  • 推荐

如何用大模型评估大模型——PAI-Judge 裁判员大语言模型的实现简介

阿里云人工智能平台 PAI 推出 PAI-Judge 裁判员大模型,为用户构建符合应用场景的多维度、细粒度的评测体系,支持单模型评测和双模型竞技两种模式,允许用户自定义参数,实现准确、灵活、高效的模型自动化评测,为模型迭代优化提供数据支撑。

PAI 大语言模型评测平台现已支持裁判员模型评测

本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,无代码评价开源模型或者微调后模型的性能,并通过不同模型间性能对比,选择符合自己场景的模型。

模型评测_模型评测技术文章_InfoQ写作社区