写点什么

AI 产品经理必懂的 3 个大模型微调指标

  • 2025-07-14
    北京
  • 本文字数:925 字

    阅读完需:约 3 分钟

AI产品经理必懂的3个大模型微调指标

哈喽,大家好!

我是阿星👋

天天听微调,什么微调是好,什么样的算失败呢?

怎么判断训练效果呢?

一般看下面三个指标(小白可读)——

(关于什么是微调可以看之前推过的)


1、训练损失 Training Loss

可以先进行 3 轮学习,每次学完考试,可能会考原题,考的都是训练集里的题。所以当然和答案差距越小说明学的越好。训练损失考察的是依从能力,我们越来越朝着理想的训练结果走。😊


但是训练很多次后你可能发现数值没变,最常见的 2 个原因就是你数据质量不行,要么就是你数据太少了😭。因为你数据不给力,无法再继续提升了。


2、验证损失 Validation Loss

验证损失这个指标,有点像让模型考非原题,我们可能会把训练集中的一部分题抽出来不去训练,等训练完了再坏坏地拿这些没有练过的题让模型回答😂


回答完了之后对比一下,和我们答案对比一下,相差越小成绩越好,说明模型没看所有答案(有一部分没提前学过)但是答对的确比较多🤔。所以验证损失考验的是模型的泛化能力。💪🏻


如果出现这种情

1、训练损失下降(说明答得还行),

2、验证损失没变(泛化没有提升)


又是怎么回事呢?🤔动动你的小脑筋


说明它的泛化能力下降了被阻止前进了,可能出现了过拟合的情况,过拟合的意思你可以理解为有点死脑筋,别的问题回答的没那么好,就针对训练集里的东西会得很。


这个时候唯一的办法就是增加训练集的丰富程度☁️🌧🌩。让它格局打开🚀


3、验证准确率 Validation Token Accuracy

验证准确率,你可以简单看成是验证损失的进一步计算。就是看数据集的 prompt 的输出结果,和验证集答案的相似度。


4、目前常见的微调工具

常用的有两种,如果你已经在关注微调,相信你已经有技术基础。


1、阿里云百炼

支持通义模型和开源模型

比较主流

成本较低 sft 7B 千条数据全参成本低于 10 元



2、LLaMA-Factory

开源微调工具

支持大部分开源模型

支持所有微调方式

硬件要求较高,GPU 必须有,至少你要要 32GB 内存以上


之前有写相关教程,小白可以上手体验~👇

零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程


5、图像生成微调

微大部分微调线上你可以用 liblib、吐司、堆友都可以,开源的你可以选 diffusers。所以看到这里大家应该对微调的基本指标有了一个最简单的了解。但是如果你仔细看我之前写过的文章,你就会发现它是有特定场景才需要微调的。


发布于: 刚刚阅读数: 3
用户头像

全平台同名 2025-05-15 加入

zuojialongxi

评论

发布
暂无评论
AI产品经理必懂的3个大模型微调指标_AI_阿星AI工作室_InfoQ写作社区