AI 产品经理必懂的 3 个大模型微调指标

哈喽,大家好!
我是阿星👋
天天听微调,什么微调是好,什么样的算失败呢?
怎么判断训练效果呢?
一般看下面三个指标(小白可读)——
(关于什么是微调可以看之前推过的)
1、训练损失 Training Loss
可以先进行 3 轮学习,每次学完考试,可能会考原题,考的都是训练集里的题。所以当然和答案差距越小说明学的越好。训练损失考察的是依从能力,我们越来越朝着理想的训练结果走。😊
但是训练很多次后你可能发现数值没变,最常见的 2 个原因就是你数据质量不行,要么就是你数据太少了😭。因为你数据不给力,无法再继续提升了。
2、验证损失 Validation Loss
验证损失这个指标,有点像让模型考非原题,我们可能会把训练集中的一部分题抽出来不去训练,等训练完了再坏坏地拿这些没有练过的题让模型回答😂
回答完了之后对比一下,和我们答案对比一下,相差越小成绩越好,说明模型没看所有答案(有一部分没提前学过)但是答对的确比较多🤔。所以验证损失考验的是模型的泛化能力。💪🏻
如果出现这种情
1、训练损失下降(说明答得还行),
2、验证损失没变(泛化没有提升)
又是怎么回事呢?🤔动动你的小脑筋
说明它的泛化能力下降了被阻止前进了,可能出现了过拟合的情况,过拟合的意思你可以理解为有点死脑筋,别的问题回答的没那么好,就针对训练集里的东西会得很。
这个时候唯一的办法就是增加训练集的丰富程度☁️🌧🌩。让它格局打开🚀
3、验证准确率 Validation Token Accuracy
验证准确率,你可以简单看成是验证损失的进一步计算。就是看数据集的 prompt 的输出结果,和验证集答案的相似度。
4、目前常见的微调工具
常用的有两种,如果你已经在关注微调,相信你已经有技术基础。
1、阿里云百炼
支持通义模型和开源模型
比较主流
成本较低 sft 7B 千条数据全参成本低于 10 元

2、LLaMA-Factory
开源微调工具
支持大部分开源模型
支持所有微调方式
硬件要求较高,GPU 必须有,至少你要要 32GB 内存以上
之前有写相关教程,小白可以上手体验~👇
零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程
5、图像生成微调
微大部分微调线上你可以用 liblib、吐司、堆友都可以,开源的你可以选 diffusers。所以看到这里大家应该对微调的基本指标有了一个最简单的了解。但是如果你仔细看我之前写过的文章,你就会发现它是有特定场景才需要微调的。
版权声明: 本文为 InfoQ 作者【阿星AI工作室】的原创文章。
原文链接:【http://xie.infoq.cn/article/3f7a709f61648614dc871be91】。未经作者许可,禁止转载。
评论