写点什么

超强组合!Dify+Milvus 构建生产级 RAG 系统的终极指南

  • 2025-07-31
    陕西
  • 本文字数:2595 字

    阅读完需:约 9 分钟

原理介绍

大语言模型常因知识局限而产生“幻觉”。检索增强生成(RAG)技术通过连接外部知识库,有效解决了这一痛点。要实现高效的 RAG,一个强大的向量数据库至关重要。本文将聚焦于业界领先的 Milvus,并借助低代码 AI 平台 Dify,向您展示如何将二者无缝结合,快速搭建一个企业级的 RAG 应用,直观感受向量数据库在解决 AI“最后一公里”问题上的核心价值。

阿里云 Milvus 基本原理介绍

基本原理与架构概述

Milvus 是专为向量相似性搜索设计的分布式数据库,其核心基于以下关键技术:


  • 近似最近邻搜索(ANN):通过 HNSW、IVF、PQ 等算法实现高效向量检索,平衡精度与速度。

  • 向量索引与查询分离:支持动态构建多种索引类型(如 FLAT、IVF_FLAT、IVF_PQ、HNSW),适配不同场景需求。

  • 向量数据分片与分布式计算:数据水平切分(Sharding)并行处理,实现高吞吐与低延迟。


采用云原生和存算分离的微服务架构。该架构分为接入、协调、执行和存储四层。各组件可独立扩展,确保了系统的高性能、高可用性和弹性。它依赖成熟的第三方组件(如 etcd、对象存储)进行数据和元数据管理,稳定可靠。



阿里云 Milvus 系统架构图

使用场景

阿里云 Milvus 适用于任何需要进行“相似性”匹配的场景。其核心应用包括:


  • 图像视频搜索:如电商平台的以图搜图、安防领域的人脸识别和视频轨迹追踪。

  • 文本语义搜索:构建智能客服、企业内部文档知识库和代码搜索引擎,能精准理解用户意图,而非简单的关键词匹配。

  • 个性化推荐系统:根据用户的行为和偏好向量,实时推荐最相似的商品、音乐、新闻或视频。

  • 前沿科学与安全:在生物信息学中加速药物分子筛选,或在网络安全领域进行异常流量和欺诈行为检测。

  • 智能驾驶数据准备与挖掘:对点云图像、车载传感器收集的音视频等多模态数据进行向量数据的实时查询。

Dify 平台介绍

Dify 是开源人工智能应用开发平台,具有低代码的工作流和友好的用户界面的特点,其核心使命是通过将“后端即服务”(Backend-as-a-Service)与“大语言模型运维”(LLMOps)的理念深度融合,来彻底简化和加速 AI 应用的构建全过程。


作为一个全栈式的解决方案,Dify 在后端层面,提供了稳定可靠的 API 服务、数据管理等基础设施,让开发者无需从零搭建;在 LLM 运维层面,提供了一个直观的可视化提示词编排界面,让复杂的提示工程变得简单高效。其内置的高质量检索增强生成(RAG)引擎,能够轻松连接企业文档、数据库等私有知识库,让大模型基于特定领域的知识进行回答,有效减少了信息幻觉,并确保答案的准确性和可追溯性。

操作步骤

前提条件

1、Dify 安装与配置

安装 Dify

请通过 Git 命令将开源 Dify 项目从 GitHub 克隆至本地。


git clone https://github.com/langgenius/dify.git
复制代码


进入目录备份.env 配置文件


cd difycd dockercp .env.example .env
复制代码


修改配置文件.env


VECTOR_STORE=milvusMILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530MILVUS_USER=YOUR_ALIYUN_MILVUS_USERMILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD
复制代码


注意


  • 将 YOUR_ALIYUN_MILVUS_ENDPOINT 替换为您的阿里云 Milvus 公网地址。


  • 将 YOUR_ALIYUN_MILVUS_USER 替换为您的阿里云 Milvus 用户。


  • 将 YOUR_ALIYUN_MILVUS_PASSWORD 替换为您的阿里云 Milvus 密码。


启动 Dify


docker compose up -d
复制代码


安装成功验证

启动后访问部署的 Dify 服务 IP 地址http://127.0.0.1/ 进入 Dify 的登陆页面,设置管理员账号密码,并登陆进管控台。


2、设置默认模型

登录成功后,单击右上角头像,下拉菜单中选择设置。



在设置--模型提供商处安装模型供应商,在这里我们选用了通义千问的模型,可以在百炼平台获取 API-KEY。安装后,将 API-KEY 输入,验证绿灯即可。


弹出的设置菜单中,选择左侧模型供应商,下拉选择通义千问,单击安装按钮安装模型。



模型安装成功后,选择设置 API-KEY,将提前准备好的百炼平台 API-KEY 输入。




系统模型设置可以参照以下设置。



验证绿灯即可。


3、准备数据集创建知识库

接下来准备测试数据来创建知识库。

单击上方知识库按钮,点击创建知识库。



数据源选择导入已有文本,您可以点此下载示例数据阿里云Milvus简介



数据源参考如下配置,单击保存并处理。



可以看到数据库已经成功创建,并且索引创建完毕


4、验证向量检索是否成功

通过 docker logs 查看,可以看到 dify 日志里显示上传成功



登录阿里云Milvus控制台,选择您配置的 Milvus 实例,单击右上角 Attu Manager 进入 Attu 页面,可以看到对应的 collection 数据已导入。详情请参见Attu工具管理



5、验证 RAG 效果

单击上方工作室回到首页,选择从应用模板中创建。



左侧菜单中选择 Knowledge Retrieval,使用 knowledge Retreival + Chatbot 模板。



创建模板。



选择 Knowledge Retrieval 节点,知识库设置为上面步骤中创建的知识库。



选择 LLM 节点,将模型设置为 qwen-max。



单击右上角发布按钮,选择发布更新。



选择运行,进入测试页面,输入一个与知识库中内容相关的问题,即可获得答案。



同样,阿里云人工智能平台 PAI 支持在 Dify 工作流中调用推理服务 PAI-EAS 部署的模型。使用阿里云人工智能平台 PAI 作为云端大模型部署资源,开启稳定、高效的 AI 开发新体验。


具体操作步骤为:


  1. 安装并启动 Dify;


2.使用 PAI-Model Gallery 零代码部署模型,如通义千问最新 Think 模型:Qwen3-235B-A22B-Thinking-2507;


  1. 返回 Dify 页面,配置 PAI 部署的模型调用地址等信息;

  2. 执行完整 Dify 工作流。

立即体验

我们诚邀您立即体验阿里云 Milvus 的强大功能!


免费试用:产品新用户可免费试用向量检索服务 Milvus 版入门 8 vCPU 32 GiB 1 个月和模型推理服务 PAI-EAS 500 元大模型部署额度(1 个月内有效)。


领取地址:向量检索服务 Milvus 版 >> https://x.sm.cn/FXQT0f5;人工智能平台 PAI >> https://free.aliyun.com/?productCode=learn


年付 5 折:覆盖阿里云 Milvus 全规格产品。


节省计划:阿里云人工智能平台 PAI 预付活动低至 3 折,59 可抵 200、1080 可抵 1500、12000 可抵 15000,模型训练、部署等各阶段均适用,无机型和地域限制。


通用 RAG 超值套餐(PAI+Milvus ):https://common-buy.aliyun.com/package?spm=ntm.workbench-commodities-planlist-list.0.0.3b9619afGbhcFy&planCode=package_milvuspaieas_cn


欢迎前往产品详情页购买体验!https://www.aliyun.com/product/milvus


用户头像

还未添加个人签名 2020-10-15 加入

分享阿里云计算平台的大数据和AI方向的技术创新和趋势、实战案例、经验总结。

评论

发布
暂无评论
超强组合!Dify+Milvus构建生产级RAG系统的终极指南_人工智能_阿里云大数据AI技术_InfoQ写作社区