写点什么

华为开发者空间:基于 DeepSeek 构建 RAG 向量数据库

  • 2025-03-04
    广东
  • 本文字数:1838 字

    阅读完需:约 6 分钟

华为开发者空间:基于DeepSeek构建RAG向量数据库

摘要:让大家熟悉如何通过云主机部署 DeepSeek,并且通过本地部署的 DeepSeek 快速搭建 RAG 向量数据库。

本文分享自华为云社区《本地部署DeepSeek构建RAG向量数据库》,作者:开发者空间小蜜蜂。

如您还没有云主机,可点击链接,根据领取指南进行操作。

一、案例介绍

本文将介绍如何通过在云主机部署 Deepseek 模型,在基于本地部署的前提下快速搭建属于自己的 RAG 向量数据库。RAG 是检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种结合信息检索和生成式 AI 的技术架构。RAG 通过从外部知识库(如文档、数据库)中检索相关信息,并将其作为上下文输入给 LLM(大型语言模型),从而提高回答的准确性,减少幻觉问题。

通过实际操作,让大家熟悉如何通过云主机部署 DeepSeek,并且通过本地部署的 DeepSeek 快速搭建 RAG 向量数据库!

二、案例时间

本案例总时长预计 60 分钟。

三、案例流程


说明:

① 云主机安装 Ollama;

② 使用 Ollama 部署 DeepSeek 和 mxbai-embed-large 词向量模型;

③ 云主机获取项目代码及调取本地 DeepSeek;

④ 上传数据集,构建 RAG 向量数据库。

四、资源总览

本案例预计花费总计 0 元。

五、云主机部署 DeepSeek

5.1 安装 Ollama

Ollama 是一个强大的开源工具,旨在帮助用户轻松地在本地运行、部署和管理大型语言模型(LLMs)。它提供了一个简单的命令行界面,使用户能够快速下载、运行和与各种预训练的语言模型进行交互。Ollama 支持多种模型架构,并且特别适合那些希望在本地环境中使用 LLMs 的开发者和研究人员。

在云主机桌面右键选择“Open Terminal Here”,打开命令终端窗口。


执行安装命令如下:

curl -fsSL https://ollama.com/install.sh | sh
复制代码



5.2 模型部署

接下来可以借助 Ollama 工具来部署 Deepseek 大模型,部署 deepseek-r1:1.5b 版本,执行命令:

ollama run deepseek-r1:1.5b
复制代码



部署的时间长短依赖于网络的情况,部署完成后,我们就可以与 Deepseek 大模型进行对话了:


在桌面重新打开一个终端将以下命令复制进去,下载 mxbai-embed-large 词向量模型。

ollama pull mxbai-embed-large
复制代码



六、RAG 向量数据库创建

6.1 虚拟环境创建

打开云主机桌面 CodeArts IDE for Python。


打开后,点击新建工程,输入工程名称:RAG,点击创建。


创建好后,左下角选择管理->设置。


在搜索框中输入:active,找到图中所示,在前方方框中点击勾选。


打开终端,前方出现(venv)字样表示创建成功,如果没有请点击小垃圾桶图标关闭终端重新打开一下。


6.2 RAG 向量数据库构建

左下角打开终端输入命令,入完毕后按下回车进行下载。下载完毕后,在左侧目录下出现 chatpdf-rag-deepseek-r1 文件夹表示下载成功。

git clone https://github.com/paquino11/chatpdf-rag-deepseek-r1
复制代码



下载完毕后,再次输入以下命令,输入完毕后按下回车,进入该目录下。

cd chatpdf-rag-deepseek-r1
复制代码



进入到目录后在终端复制以下命令下载相应环境包。

pip install -r requirements.txt
复制代码



6.3 RAG 向量数据库功能实现

下载完毕后,点击后进入 chatpdf-rag-deepseek-r1 目录,对 rag.py 文件进行修改。修改 rag.py 文件的第 23 行代码,修改后的效果如下:

def __init__(self, llm_model: str = "deepseek-r1:1.5b", embedding_model: str = "mxbai-embed-large"):
复制代码



修改完毕后,终端输入以下命令运行,首次运行可能会出现输入 Email,出现时输入自己常用 Email 即可,输入完毕后效果如下:

streamlit run app.py
复制代码



同时浏览器会自动弹出网址界面。


图示英文字符的意思如下:


Upload a Docunment:上传文档;

Settings(Number of Retrieved Results (k)):检索结果数;

Similarity Score Threshold:相似度得分阈值;

Chat History:聊天记录;

Message:提示信息。


注:上传的文档格式需要为 PDF 格式。


这里我们将提前准备好的数据进行上传。

数据可以前往以下地址自行下载获取,上传的数据中包括 AI 的基础理论知识以及常用的 AI 框架的介绍,这里上传数据是为了使大模型能够进行 RAG 向量数据库的生成,使 DeepSeek 可以读取到数据库中的内容。

https://dtse-mirrors.obs.cn-north-4.myhuaweicloud.com/case/0026/%E6%95%B0%E6%8D%AE.pdf


下载完毕后点击图中’Browse files’字样进行数据上传。


点击后选择下载的数据,再点击打开进行数据上传。


上传后等待读取(过程需要一点时间请耐心等待),数据中包含 AI 方面的基础知识,所以我们进行问题提问,这里提问:机器学习有哪些核心技术?,输入完毕后回车发送消息。


可以看到返回信息,结合我们上传的数据进行检索生成。

至此本地部署 DeepSeek 构建 RAG 向量数据库实验案例到此结束。


点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 3
用户头像

提供全面深入的云计算技术干货 2020-07-14 加入

生于云,长于云,让开发者成为决定性力量

评论

发布
暂无评论
华为开发者空间:基于DeepSeek构建RAG向量数据库_人工智能_华为云开发者联盟_InfoQ写作社区