大人,时代变了! 赶快把自有业务的本地 AI“模型”训练起来!
1.1 背景
目前AI
已经大行其道,chatGPT
、DeepSeek
等如雨后春笋般涌现出来,笔者做为一个守旧派
和顽固派
,一直认为 AI 只是雕虫小技,根本没有办法和人写的代码相提并论,在 chatGPT 已经大火几年之后仍然一直无动于衷,只是在最近才慢慢使用了豆包
查点资料,然后再接触Kimi
、DeepSeek
等 AI 工具和模型。
使用 AI 的对话问答模式,相对原来的搜索引擎,得到的结果更精练, 不会像百度、必应之类的搜索引擎,搜索到结果后还要逐页去人工筛选,AI 的回答就是干干净净你要的东西,这比搜索引擎效率高太多了! 提要求让 AI 生成些小的代码片段,如:“给我写一个vbs获取文件扩展名的函数
”,生成的代码质量也非常不错,直接拿来就能用,连测试代码也一并写好!
总结一句话:大人,时代变了,现在投降是代价最小的时候!
问题来了:目前这些 AI 工具,都是基于通用模型
, 如果用来做一些其他业务场景
的事,效果就不会太好,此时就需要训练自己的本地模型了
!
注意:在训练自己的本地模型前,请首先有一个概念,如果没有充足的硬件资源,请不要尝试在本地部署 DeepSeek-R1 模型,该模型至少需要 60G 的显存,GPU 也是 NVidia H100 规格的,且是多卡分布式!
使用线上+线下协作的方式,可能是普通人训练自己业务场景的最优选择!
1.2 准备工作
注册硅基流动账号: 硅基流动注册

下载CherryStudio
:下载CherryStudio注:目前常用的 AI 客户端只有CherryStudio
工具的知识库支持训练本地素材
1.3 训练本地知识库
比如:作者偶尔会写点EverEdit的宏脚本
(js 语法),由于 EverEdit 有自己的 API,所以 AI 必须先学习 EverEdit 的 API。
1.3.1 在CherryStudio
中配置密钥
配置密钥
是为了能够让CherryStudio
使用 AI 供应商(这里是硅基流动
)的模型
步骤 1:在siliconflow
网站登录后,拷贝自己的密钥
,如下图所示:

步骤 2:在CherryStudio
中配置密钥,如下图所示:

1.3.2 在CherryStudio
中训练本地知识库
训练本地知识库的目的:将自有业务
知识消化成知识库,结合在线 AI(如:DeepSeek),以解答自有业务
领域的问题,而避免投入大量硬件训练完整的专有本地模型。 比如:我偶尔要写EverEdit
宏脚本,因此我要训练关于EverEdit
的 API 的本地知识库。
在CherryStudio
中新建本地知识库,如下图所示:

将自有业务相关的文档丢到知识库
中进行消化
(近似动作),如下图所示:

消化完成后,会出现绿色的“√”符号
1.3.3 在CherryStudio
中使用本地知识库(自有业务)和DeepSeek
在线模型生成自有业务相关代码或答案
打开知识库开关,并选择本地知识库,如下图所示:
在CherryStudio
的导航栏选择“助手”按钮,切换到助手
模式

在界面的底部聊天窗口中选择本地知识库

提出问题并解答,如下图所示:
用户提出问题让 AI 解答

出现问题,让 AI 修正

还有问题,继续让 AI 修正

注:后面还有很多让 AI 修正的步骤,这里不一一列举。
最终 AI 生成的代码
脚本执行后的效果
对齐前:

脚本执行列对齐后:

哇!是不是很整齐!这都是 AI 自己写的脚本哦!
文章转载自:tyysoft
评论