0 人感兴趣 · 1 次引用
在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模型(基于ChatGLM3)大多数时候返回空,继续正
一个日语专业的程序猿。
提供全面深入的云计算技术干货
InfoQ签约作者
还未添加个人签名
专注分享阿里技术的丰富实践和前沿创新。