华为开发者空间:基于 DeepSeek 构建 RAG 向量数据库

摘要:让大家熟悉如何通过云主机部署 DeepSeek,并且通过本地部署的 DeepSeek 快速搭建 RAG 向量数据库。
本文分享自华为云社区《本地部署DeepSeek构建RAG向量数据库》,作者:开发者空间小蜜蜂。
如您还没有云主机,可点击链接,根据领取指南进行操作。
一、案例介绍
本文将介绍如何通过在云主机部署 Deepseek 模型,在基于本地部署的前提下快速搭建属于自己的 RAG 向量数据库。RAG 是检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性,减少幻觉问题。
通过实际操作,让大家熟悉如何通过云主机部署 DeepSeek,并且通过本地部署的 DeepSeek 快速搭建 RAG 向量数据库!
二、案例时间
本案例总时长预计 60 分钟。
三、案例流程

说明:
① 云主机安装 Ollama;
② 使用 Ollama 部署 DeepSeek 和 mxbai-embed-large 词向量模型;
③ 云主机获取项目代码及调取本地 DeepSeek;
④ 上传数据集,构建 RAG 向量数据库。
四、资源总览
本案例预计花费总计 0 元。
五、云主机部署 DeepSeek
5.1 安装 Ollama
Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。
在云主机桌面右键选择“Open Terminal Here”,打开命令终端窗口。

执行安装命令如下:

5.2 模型部署
接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:

部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了:

在桌面重新打开一个终端将以下命令复制进去,下载 mxbai-embed-large 词向量模型。

六、RAG 向量数据库创建
6.1 虚拟环境创建
打开云主机桌面 CodeArts IDE for Python。

打开后,点击新建工程,输入工程名称:RAG,点击创建。

创建好后,左下角选择管理->设置。

在搜索框中输入:active,找到图中所示,在前方方框中点击勾选。

打开终端,前方出现(venv)字样表示创建成功,如果没有请点击小垃圾桶图标关闭终端重新打开一下。

6.2 RAG 向量数据库构建
左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现 chatpdf-rag-deepseek-r1 文件夹表示下载成功。

下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。

进入到目录后在终端复制以下命令下载相应环境包。

6.3 RAG 向量数据库功能实现
下载完毕后,点击后进入 chatpdf-rag-deepseek-r1 目录,对 rag.py 文件进行修改。修改 rag.py 文件的第 23 行代码,修改后的效果如下:

修改完毕后,终端输入以下命令运行,首次运行可能会出现输入 Email,出现时输入自己常用 Email 即可,输入完毕后效果如下:

同时浏览器会自动弹出网址界面。

图示英文字符的意思如下:
Upload a Docunment:上传文档;
Settings(Number of Retrieved Results (k)):检索结果数;
Similarity Score Threshold:相似度得分阈值;
Chat History:聊天记录;
Message:提示信息。
注:上传的文档格式需要为 PDF 格式。
这里我们将提前准备好的数据进行上传。
数据可以前往以下地址自行下载获取,上传的数据中包括 AI 的基础理论知识以及常用的 AI 框架的介绍,这里上传数据是为了使大模型能够进行 RAG 向量数据库的生成,使 DeepSeek 可以读取到数据库中的内容。
https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf
下载完毕后点击图中’Browse files’字样进行数据上传。

点击后选择下载的数据,再点击打开进行数据上传。

上传后等待读取(过程需要一点时间请耐心等待),数据中包含 AI 方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。

可以看到返回信息,结合我们上传的数据进行检索生成。
至此本地部署 DeepSeek 构建 RAG 向量数据库实验案例到此结束。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/7b2a9c18edf393b08414be7b4】。文章转载请联系作者。
评论