写点什么

rag

0 人感兴趣 · 52 次引用

  • 最新
  • 推荐

Llama 3 + LangChain + HuggingFace 实现本地部署 RAG(检索增强生成)

本文介绍如何基于Llama 3大模型、以及使用本地的PDF文件作为知识库,实现RAG(检索增强生成)。

https://static001.geekbang.org/infoq/d2/d28815873e9a5b597f2b3debc7356dd4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 RAG-GPT 集成智谱 AI、DeepSeek 快速搭建 OpenAI Cookbook 智能客服

本文介绍了如何使用RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAI Cookbook智能客服。通过结合索引、检索和生成模块,RAG系统能够提供上下文相关、准确且最新的信息。RAG-GPT项目开源且易于部署,为企业提供了一整套智能客服解决方案。

https://static001.geekbang.org/infoq/91/9186529fee45f85ce8c5493908df6dc8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG-GPT 实践过程中遇到的挑战

本文探讨了RAG-GPT在构建智能客服系统中的挑战与解决方案,详细介绍了RAG系统的优势、核心流程及潜在故障点,并提出了优化策略。OpenIM通过开源RAG-GPT项目,提供高效、智能的客服解决方案,提升用户体验。

https://static001.geekbang.org/infoq/69/69c87b0bbabdf53299eab1d01f4ffb18.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 RAG-GPT 和 Ollama 搭建智能客服

前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服。有些场景,用户可能无法通过往外网访问OpenAI等云端LLM服务,或者由于数据隐私等安全问题,需要本地部署大模型。本文将介绍通过RAG-GPT和Ollama搭建智能客服。

https://static001.geekbang.org/infoq/f3/f3e9f48bbcfeeecd256673f9cd971ff6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OpenIM Bot: 用 LLM 构建企业专属的智能客服

OpenIM Bot 结合LLM和RAG技术,提供高效智能的用户支持服务。通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升用户体验。

https://static001.geekbang.org/infoq/8e/8ea4e0f1f9ad451f17f48dd882398bd5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

QAnything 1.4.1 中的文档解析

近日,QAnything发布了1.4.1开源版本,我们升级了文档解析模块,支持更精确的回答,支持表格问答,支持答案带配图。本文介绍我们对文档解析的理解,详细处理逻辑,以及最新效果展示。

利用英特尔 Gaudi 2 和至强 CPU 构建经济高效的企业级 RAG 应用

检索增强生成 (Retrieval Augmented Generation,RAG) 可将存储在外部数据库中的新鲜领域知识纳入大语言模型以增强其文本生成能力。其提供了一种将公司数据与训练期间语言模型学到的知识分开的方式,有助于我们在性能、准确性及安全隐私之间进行有效折衷。

基于 Milvus + LlamaIndex 实现高级 RAG

用户头像
Zilliz
05-22

随着大语言模型(LLM)技术的发展,RAG(Retrieval Augmented Generation)技术得到了广泛探讨和研究,越来越多的高级 RAG 检索方法也随之被人发现,相对于普通的 RAG 检索,高级 RAG 通过更深化的技术细节、更复杂的搜索策略,提供出了更准确、更相关、更丰

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 07:在 RAG 系统中进行表格数据处理的新思路

编者按: 目前,检索增强生成(RAG)系统成为了将海量知识赋能于大模型的关键技术之一。然而,如何高效地处理半结构化和非结构化数据,尤其是文档中的表格数据,仍然是 RAG 系统面临的一大难题。

https://static001.geekbang.org/infoq/6f/6f36cf12d1ab3fd12d711104fa330806.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

玩转数据之使用 ElasticSearch 搭建 RAG

在之前的案例视频中我们演示了使用Milvus向量数据库和腾讯向量数据库实现RAG的场景应用。今天我们演示下利用ES的向量数据存储能力来实现RAG,包括三个部分:连接ES数据库并建表;数据写入ES向量数据库流程;问答对话流程。具体操作可参照下面的视频:

https://static001.geekbang.org/infoq/a0/a01bcc615cf662b951779e9d072304f7.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

5 分钟搭建「项目文档问答机器人」

通过 LangChain、FastUI 和 Pluto 构建带有 Web 界面的文档问答机器人,只需要 5 分钟就可以基于你的 GitHub 文档仓库创建一个专属的 Web 问答机器人。

RAG 修炼手册|揭秘 RAG 时代的新向量数据库

用户头像
Zilliz
05-07

随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 05:探讨基于文本内在语义信息的数据分块方法

编者按:在 RAG (Retrieval Augmented Generation) 系统中,将文本数据高效地划分成相对独立且富有语义信息的数据块(chunks)是一项较为关键的任务。基于规则的传统数据分块方法存在一些问题,因此探讨基于文本内在语义信息的数据分块方法非常必要。

文本向量化模型新突破——acge_text_embedding 勇夺 C-MTEB 榜首

国产自研文本向量化模型acge_text_embedding(以下简称“acge模型”)已经在业界权威的中文语义向量评测基准C-MTEB(Chinese Massive Text Embedding Benchmark)中获得了第一名。

RAG 修炼手册|如何评估 RAG 应用?

用户头像
Zilliz
04-23

如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 04:重排序(Re-ranking)技术探讨

编者按:重排序(Re-ranking)技术在检索增强生成(Retrieval Augmented Generation,RAG)系统中扮演着关键角色。通过对检索到的上下文进行筛选和排序,可以提高 RAG 系统的有效性和准确性,为最终的结果生成提供更精准的信息。

提高 RAG 应用准确度,时下流行的 Reranker 了解一下?

用户头像
Zilliz
04-17

检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 03:运用 RAGAs 与 LlamaIndex 评估 RAG 应用

编者按:目前,检索增强生成(Retrieval Augmented Generation,RAG)技术已经广泛使用于各种大模型应用场景。然而,如何准确评估 RAG 系统的性能和效果,一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估,也难以针对性地优化

为什么向量数据库在 RAG 中至关重要?

用户头像
Zilliz
04-11

什么是向量数据库?一个专业的向量数据库究竟是如何运转的?它又是如何为产业赋能的?开箱即用的云原生向量数据库该怎么用?

RAG 修炼手册|一文讲透 RAG 背后的技术

用户头像
Zilliz
04-10

在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战

编者按: 自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。

RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要

用户头像
Zilliz
03-28

Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。

基于大模型和向量数据库的 RAG 示例

RAG是一种先进的自然语言处理方法,它结合了信息检索和文本生成技术,用于提高问答系统、聊天机器人等应用的性能。

RAG 一文读懂!概念、场景、优势、对比微调与项目代码示例

本文结合“基于 ERNIE SDK+LangChain 搭建个人知识库”的代码示例,为您讲解 RAG 的相关概念。

https://static001.geekbang.org/infoq/b0/b072c2b410f3c04638f7c30b2e61f0ab.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG 一文读懂!概念、场景、优势、对比微调与项目代码示例

本文结合“基于ERNIE SDK+LangChain搭建个人知识库”的代码示例,为您讲解RAG的相关概念。

揭秘「 B 站最火的 RAG 应用」是如何炼成的

用户头像
Zilliz
02-28

“当我开发出史料检索 RAG 应用,正史怪又该如何应对?” 。

揭秘 LLMs 时代向量数据库的 3 大实用场景

用户头像
Zilliz
02-21

过去一年,ChatGPT 和其他大语言模型(LLMs)的爆火也带动了向量数据库的发展。

rag_rag技术文章_InfoQ写作社区