使用 RAG-GPT 集成智谱 AI、DeepSeek 快速搭建 OpenAI Cookbook 智能客服

2024-05-29
广东
本文字数：3583 字
阅读完需：约 12 分钟

引言

前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服，目前国内也有一些比较不错的云端大模型 API 服务。本文将介绍通过 RAG-GPT 集成智谱AI和DeepSeek，快速搭建OpenAI Cookbook智能客服。

RAG 技术原理介绍

在介绍 RAG-GPT 项目之前，我们首先要理解 RAG 的基本原理，RAG 在问答系统中的一个典型应用主要包括三个模块，分别是：

Indexing（索引）：将文档分割成 chunk，编码成向量，并存储在向量数据库中。
Retrieval（检索）：根据用户输入 query 和向量数据库中 chunks 语义相似度检索与问题最相关的前 k 个 chunk，形成本次问答的上下文。
Generation（生成）：将原始问题和检索到的 chunks 整合形成合适的 prompt 一起输入到 LLM 中，让 LLM 输出与上下文有关的回答。

智能文档的在线检索流程可以用一张图说明，上图中展示了一个完整的问答流程：

用户发起 query
结合 Bot 实际应用场景，评估是否对 query 进行 rewrite
Retieval 模块根据 query 检索出 Indexing 中的相关的文档
将召回的文档进行 Reranking
并且根据 relevance score 进行过滤，过滤掉低质的文档
形成合适的 Prompt 后输入到 LLM 大模型中，最后生成答案

以上是对 RAG 技术的基本介绍，如果想深入了解技术细节可以参考这篇文章：RAG技术全解析：打造下一代智能问答系统。

如何快速实现 RAG 的智能问答系统？

从 RAG 的原理介绍中可以看到要实现 RAG 整套架构还是存在一定工作量，需要构建索引、检索、集成 LLM、Prompt 优化等一系列模块，具有一定的难度。

基于此，RAG-GPT 提供了一整套开源解决方案，旨在利用 LLM 和 RAG 技术快速搭建一个全功能的客服解决方案。该项目基于 Flask 框架，包括前端用户界面、后端服务和管理员控制台，为企业利用 LLM 搭建智能客服等对话场景提供了一个完整的自动化解决方案，可以帮助开发者快速搭建一个智能问答系统，且代码完全开源。项目地址：https://github.com/open-kf/rag-gpt

RAG-GPT 的基本架构

RAG-GPT 关键特性：

内置 LLM 支持：支持云端 LLM 和本地 LLM。
快速设置：只需五分钟即可部署生产级对话服务机器人。
多样化知识库集成：支持多种类型的知识库，包括网站、独立 URL 和本地文件。
灵活配置：提供用户友好的后台，配备可定制的设置以简化管理。
美观的用户界面：具有可定制且视觉上吸引人的用户界面。

从特性可以知道，RAG 相比一些商业收费的基于知识库的问答系统优势在于：

易用、快速搭建。
能自主管理知识库，避免商业秘密和知识产权泄漏。
可以自主选择 LLM 模型和甚至扩展部署本地模型。

RAG-GPT 快速搭建智能问答系统

RAG-GPT 的基本组成分为三部分：

智能问答后端服务
管理后台系统
用户使用的 ChatBot UI。

下面，将介绍如何启动 RAG-GPT 项目和使用这三个模块，将 RAG-GPT 集成到你的网站只需要 5 个步骤：

1. 下载源代码，通过 Git 克隆 RAG-GPT 的 GitHub 仓库：

git clone https://github.com/open-kf/rag-gpt.git && cd rag-gpt

复制代码

2.配置环境变量

在启动 RAG-GPT 服务之前，需要修改相关配置，以便程序正确初始化。

如果使用智谱AI作为 LLM 底座

cp env_of_zhipuai .env

复制代码

.env 文件中的变量

LLM_NAME="ZhipuAI"ZHIPUAI_API_KEY="xxxx"GLM_MODEL_NAME="glm-3-turbo"MIN_RELEVANCE_SCORE=0.3BOT_TOPIC="xxxx"URL_PREFIX="http://127.0.0.1:7000/"USE_PREPROCESS_QUERY=0USE_RERANKING=1USE_DEBUG=0

复制代码

对 .env 中的变量做以下调整：

不要修改 LLM_NAME。
将 ZHIPUAI_API_KEY 替换为你自己的密钥。请登录智谱AI网站查看你的 API 密钥。
更新 GLM_MODEL_NAME 设置，将 glm-3-turbo 替换为 glm-4，如果你想使用 GLM-4。
将 BOT_TOPIC 更改为你的机器人的名称。这非常重要，因为它将在构造Prompt中使用。我在这里要搭建 OpenAI Cookbook 网站的智能客服，所以改写为OpenAI Cookbook。
调整 URL_PREFIX 以匹配你的网站的域名。
有关常量的含义和用法的更多信息，可以查看 server/constant 目录下的文件。

如果使用DeepSeek作为 LLM 底座

[!NOTE]DeepSeek 没有提供 Embedding API，这里使用 ZhipuAI 的 Embedding API。我们需要同时准备ZHIPUAI_API_KEY和DEEPSEEK_API_KEY。

cp env_of_deepseek .env

复制代码

.env 文件中的变量

LLM_NAME="DeepSeek"ZHIPUAI_API_KEY="xxxx"DEEPSEEK_API_KEY="xxxx"DEEPSEEK_MODEL_NAME="deepseek-chat"MIN_RELEVANCE_SCORE=0.3BOT_TOPIC="xxxx"URL_PREFIX="http://127.0.0.1:7000/"USE_PREPROCESS_QUERY=0USE_RERANKING=1USE_DEBUG=0

复制代码

对 .env 中的变量做以下调整：

不要修改 LLM_NAME。
将 ZHIPUAI_API_KEY 替换为你自己的密钥。请登录智谱AI网站查看你的 API 密钥。
将 DEEPSEEK_API_KEY 替换为你自己的密钥。请登录DeepSeek网站查看你的 API 密钥。
更新 DEEPSEEK_MODEL_NAME 设置，目前只有deepseek-chat这个合适的选项。
将 BOT_TOPIC 更改为你的机器人的名称。这非常重要，因为它将在构造Prompt中使用。我在这里要搭建 OpenAI Cookbook 网站的智能客服，所以改写为OpenAI Cookbook。
调整 URL_PREFIX 以匹配你的网站的域名。
有关常量的含义和用法的更多信息，可以查看 server/constant 目录下的文件。

3.执行启动命令

分别执行以下命令，即可启动。

[!NOTE]请使用 Python 3.10.x 或以上版本。

先安装 python 依赖项

python3 -m venv myenv

复制代码

source myenv/bin/activate

复制代码

pip install -r requirements.txt

复制代码

启动项目即可：

python create_sqlite_db.pypython rag_gpt_app.py

复制代码

或者执行

sh start.sh

复制代码

4.快速体验聊天效果

启动服务后先打开管理后台。

首先要登录到管理后台，浏览器输入：http://127.0.0.1:7000/open-kf-admin/登录账号为：**admin** 密码：**open_kf_AIGC@2024** .

导入知识库，这里输入 LangChain 的网站。

在管理后台切换到 Source tab，输入想要抓取的OpenAI Cookbook的网页地址列表：

https://cookbook.openai.com/https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4ohttps://cookbook.openai.com/examples/batch_processinghttps://cookbook.openai.com/examples/assistants_api_overview_pythonhttps://cookbook.openai.com/examples/gpt_with_vision_for_video_understandinghttps://cookbook.openai.com/examples/multimodal/using_gpt4_vision_with_function_callinghttps://cookbook.openai.com/examples/creating_slides_with_assistants_api_and_dall-e3https://cookbook.openai.com/examples/parse_pdf_docs_for_raghttps://cookbook.openai.com/examples/custom_image_embedding_searchhttps://cookbook.openai.com/examples/evaluation/evaluate_rag_with_llamaindex

复制代码

点击 Submit 即可一键爬取上面网页的内容作为知识库。

获取网站的所有网页 URL 后，此时网页 URL 展示的状态是 Recorded。服务端会通过一个异步任务处理网页内容抓取，并且计算 Embedding，然后存入向量数据库。

服务端处理完后，可以看到爬取网页 URL 的日志。

在 admin 页面，在管理后台上所有网页 URL 展示的状态都是 Trained 。

浏览器打开http://127.0.0.1:7000/open-kf-chatbot/，就可以访问Bot了。

5.一键嵌入到网站

RAG-GPT 提供了将聊天机器人嵌入到网站的方法，使得用户可以直接在网站上使用智能问答服务。打开管理后台菜单切换到 embed，复制两个代码即可实现一键嵌入，这两个代码片效果分别如下：一个是 iframe 嵌入一个聊天窗口，一个是在页面右下角点击弹出聊天窗口。可以新建一个文本文件，将代码复制进去，用浏览器打开就可以看到嵌入效果了。

6.管理后台其他功能

管理员可以通过仪表板查看用户的历史请求记录，以便进行分析和优化。

可以按照时间、用户查询聊天记录和修改问答对的答案以更符合自身需求。

配置聊天对话的 UI

用户可以定制化聊天对话框的风格，使其更符合自身网站的风格特性。

结语

RAG-GPT 项目具备开源免费、易于部署集成、开箱即用和功能丰富的特点，为 LLM 大模型在特定领域的应用落地提供了一套企业级的解决方案。RAG-GPT 已经支持本地文件知识库，集成国内 LLM 大模型等特性，使得 RAG-GPT 满足更多样化的需求。

关于我们

OpenIM 是领先的开源即时通讯（IM）平台，目前在 GitHub 上的星标已超过 13k。随着数据和隐私安全的重视以及信息技术的快速发展，政府和企业对于私有部署的 IM 需求急剧增长。OpenIM 凭借“安全可控”的特点，在协同办公软件市场中占据了一席之地。在后 AIGC 时代，IM 作为人机交互的首要接口，其价值愈发重要，OpenIM 期待在此时代扮演更关键的角色。

基于这样的视角，我们最近开源了 RAG-GPT 项目，已被部分企业采用并持续完善中。如果您对 RAG-GPT 感兴趣，可以访问以下链接了解更多信息：

项目地址： https://github.com/open-kf/rag-gpt

在线 Demo： https://demo.rentsoft.cn/

我们的目标是改进文件管理功能，更有效地管理数据，并整合企业级知识库。欢迎大家在 GitHub 上 Star 并关注，支持我们的开源旅程。

开源说明：RAG-GPT 采用 Apache 2.0 许可，支持免费使用和二次开发。遇到问题时，请在 GitHub 提 Issue 或加入我们的 OpenKF 开源社区群讨论。如果您需要更智能的客服系统，请与我们联系。

发布于: 刚刚阅读数: 3

原文链接:【http://xie.infoq.cn/article/e4ebdcf9112652eebda4a846d】。

AI Inception

关注

还未添加个人签名 2018-12-26 加入

还未添加个人简介

发布

暂无评论

创作场景

使用 RAG-GPT 集成智谱 AI、DeepSeek 快速搭建 OpenAI Cookbook 智能客服

引言

RAG 技术原理介绍

如何快速实现 RAG 的智能问答系统？

RAG-GPT 的基本架构

RAG-GPT 快速搭建智能问答系统

1. 下载源代码，通过 Git 克隆 RAG-GPT 的 GitHub 仓库：

2.配置环境变量

3.执行启动命令

4.快速体验聊天效果

5.一键嵌入到网站

6.管理后台其他功能

结语

关于我们

AI Inception

评论