写点什么

如何给本地部署的 DeepSeek 投喂数据,让他更懂你

作者:EquatorCoco
  • 2025-02-14
    福建
  • 本文字数:1019 字

    阅读完需:约 3 分钟

写在前面


为啥要本地部署呢?


① 在使用DeepSeek中,经常会出现服务器繁忙,请稍后再试。

② 不想让个人隐私数据暴露出去

③ 可以将各种格式的文件,如 pdf、csv、txt、md 格式的数据投喂给它。比如你想让 DeepSeek 了解你的公司业务,就把相关的文档上传给它。


DeepSeek 就能吃下你给它的各种“知识大餐”,然后变得更聪明,更懂你


一、RAG 是什么?


为了投喂数据,我们要用到 RAG。首先,我们先来了解下什么是 RAG?


我们就问问昨天部署好的DeepSeek好了。


首先我们在命令行输入:ollama run deepseek-r1:1.5b 命令,启动DeepSeek



然后打开浏览器并输入快捷键:ctrl+shift+l 调出WebUI可视化 AI 界面



输入:RAG 是什么?



翻译成大白话就是:我们把知识放到知识库里,然后把它投喂给人工智能。我们需要用一个量化的工具,把各种格式的数据量化给人工智能,让它能看得懂。


人工智能通过对这些知识的学习后,以后你再问它的时候,他就能将知识提取出来,加工处理后回答你的问题。


RAG 就是让 DeepSeek 不仅能靠自己的知识库回答问题,还能通过检索外部数据来增强回答的准确性和丰富性。就好比你考试时偷偷带了小抄,但 DeepSeek 是光明正大地“作弊”,还能把答案说得头头是道。


二、 拉取nomic-embed-text


刚说了 RAG 是啥?我们需要一个 RAG 工具来完成量化工作。


各种开源免费的 RAG 工具挺多,我们这里选择最近比较获得ollama 提供的nomic-embed-text


https://ollama.com/library/nomic-embed-text



我们使用上面圈出来的命令拉取即可,274M,大约 1min 左右就可以下完,出现【success】字样表示下载成功。



三、RAG 设置


打开WebUI界面,我们会看到一个 RAG 设置文本嵌入模型


文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。



四、添加新知识


工具都准备好后,我们开始准备给DeepSeek投喂数据......


① 投喂前不认识晓凡


在投喂数据之前,我们问问它认不认识晓凡。结果不用我说了,肯定是不知道的 😅



② 准备投喂的数据


接下来,将晓凡事先准备好的关于晓凡的简介【程序员晓凡.md】文档投喂给它,文档内容如下。



③ 投喂数据





④ 投喂完成后,已经认识晓凡了



五、其他数据投喂测试


我们准备一个【学生选课系统接口文档 V1.1.md】接口文档



按照上面方法进行投喂



接下来,我们我们让DeepSeek 用 Java 语言实现【获取学生选课信息】这一接口功能



本期内容到这儿就结束了,希望对您有所帮助。


文章转载自:程序员晓凡

原文链接:https://www.cnblogs.com/xiezhr/p/18714692

体验地址:http://www.jnpfsoft.com/?from=001YH

用户头像

EquatorCoco

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

评论

发布
暂无评论
如何给本地部署的DeepSeek投喂数据,让他更懂你_人工智能_EquatorCoco_InfoQ写作社区