写点什么

DeepSeek 搭建个人知识库教程

作者:派大星
  • 2025-03-05
    北京
  • 本文字数:1917 字

    阅读完需:约 6 分钟

各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!


不过,今天我要给大家分享一个超实用的技巧:利用 DeepSeek 创建专属的 AI 知识库!我自己已经开始使用这个方法了,效果简直出乎意料地好。它不仅让 AI 变得超可靠,还从根本上消除了商业机密泄露的风险。


其实,在 AI 出现之前,私有知识库就已经在很多场景中发挥了巨大作用,比如企业内部知识管理、个人知识储备等。而当它与出色的 DeepSeek 相结合后,知识检索和归纳的效率简直提升到了一个新的高度。

小白快速搭建个人 AI 知识库

个人 AI 知识库的方案多种多样,今天我来介绍一种既简单又高效的方法,特别适合新手。这种方法结合了 AnythingLLM 和 DeepSeek R1,不仅操作简单,而且知识检索效果出色。

工具简介

  • AnythingLLM:这是一个知识库管理的前端工具,提供从上传知识、向量化数据到检索增强生成(RAG)的全流程服务。它完全开源且免费,非常适合个人用户。

  • DeepSeek R1:这是幻方量化推出的大模型,性能与 Claude 3.5 相当,但 Token 成本极低。在本次方案中,我们将使用 DeepSeek R1 作为推理模型。

注意事项

  • 模型选择:虽然我们推荐使用 DeepSeek R1,但 AnythingLLM 也支持其他推理模型,如 GPT、Claude,或者通过 Ollama 运行本地开源模型等。你可以根据自己的需求选择合适的模型。


通过这种组合,你可以轻松搭建一个高效、低成本的个人 AI 知识库,无论是学习、工作还是研究,都能大大提高你的效率。希望这个方案对你有所帮助!

安装 AnythingLLM

下载 AnythingLLM

地址https://anythingllm.com/


AnythingLLM 是一个开源且免费的工具,采用 MIT 许可证,支持文本和多模态大语言模型(LLM)在同一界面中使用。它能够轻松处理图像和音频。


该工具也适合用作强大的 API,便于任何自定义开发或现有产品的功能扩展。AnythingLLM 拥有不断增长的插件和集成生态系统,可以增强其在应用和组织中的功能。


设计上,AnythingLLM 默认是私密的,所有数据都存储并在运行该工具的本地机器上处理。用户可以轻松下载并运行 LLM,无需额外的设置或程序。


AnythingLLM Desktop 并不是 SaaS 服务,用户无需注册即可在本地使用完整的工具套件。


此外,AnythingLLM 可以根据公司的品牌进行白标定制,并支持多个用户在同一服务器上使用,确保用户之间的完全隔离。管理员可以细致控制用户的权限和可见内容。




支持系统:Windows、Mac、Linux













配置 AI 大脑(如何使用 DeepSeekAPI 或者本地搭建 DeepSeek)

设置你的 AI 助手:DeepSeek

打开软件后,首先需要配置 LLM(大型语言模型)。这里推荐选择 DeepSeek 作为你的模型,具体选择“chat”选项,这是目前最新的模型版本。为了使用 DeepSeek 的服务,你需要一个 API Key。你可以通过访问 DeepSeek 的官网


https://platform.deepseek.com


注册账号并获取 API Key。注册过程简单,充值少量费用(几块钱)即可开始使用,非常经济实惠。




您可能会遇到这样的提示:“目前我们正在进行网站的维护与升级工作,网站暂时无法正常使用。我们正在全力推进相关工作,争取尽快恢复服务。感谢您在此期间的理解与耐心等待。”


如果官网的 API 暂时无法使用,您可以考虑使用本地部署版本的 DeepSeek。关于如何进行本地部署,可以参考文档,


本地部署 DeepSeek:打造你的专属 AI 推理环境,简单明了适合新手

进入工作区

可以在左下角设置按钮中进行基础配置,如:LLM、嵌入模型、向量数据库选择等,新手可以先保持默认设置。


(这里单独提下 Embedding 模型,Embedding 是将高纬度数据嵌入低纬度空间方便存储,模型性能影响对后续知识


检索有挺大影响,建议可以换成 bge-m3,这个模型对多语言和长文本都支持的不错,需要本地运行 0llama 加载这


个模,由于需要安装 0llama,新手可以跳过这一步)



上传文档

  1. 点击工作空间的上传按钮,




  1. 支持上传 PDF、CSV、音频或者抓取网页内容等等。上传后右键加入工作空间就 ok 了。



一定要点击 save 按钮,不然不会生效。




  1. 可以在 Data Connnector 中获取 youtube(需要有 cc 字幕)视频、confluence 文档库等内容平台的数据。


知识检索问答

  1. 工作区点击 new thread 可以开启新的对话,然后提问就 ok 了



  1. 果想判断 LLM 回答的知识范围,可以在回答的底部点开:Show Citations 就能看到引用了哪些知识



AnythingLLM 是一个很强大的知识库管理工具,新版本还提供了 Agent 模式,可以接入谷歌、bing 等搜索引擎,实现实时搜索增加检索的时效性。


如有问题,欢迎微信搜索【码上遇见你】。


好了,本章节到此告一段落。希望对你有所帮助,祝学习顺利。

发布于: 刚刚阅读数: 5
用户头像

派大星

关注

微信搜索【码上遇见你】,获取更多精彩内容 2021-12-13 加入

微信搜索【码上遇见你】,获取更多精彩内容

评论

发布
暂无评论
DeepSeek搭建个人知识库教程_DeepSeek-R1_派大星_InfoQ写作社区