写点什么

rag

0 人感兴趣 · 59 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/6a/6a98239f6e1abf8d3895f637c0707edd.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

检索生成 (RAG) vs 长文本大模型:实际应用中如何选择?

编者按:大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术:长上下文(Large Context Windows)和检索增强生成(RAG)。这两种技术各有何优势?在实际应用中,我们又该如何权衡选择?

https://static001.geekbang.org/infoq/ea/ea39775bfc5699a32651dfb3d3edbdac.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 09:『提示词压缩』技术综述

编者按: 如何最大限度地发挥 LLMs 的强大能力,同时还能控制其推理成本?这是当前业界研究的一个热点课题。

https://static001.geekbang.org/infoq/12/121b0d82808e5c998ff0a5a35fc95677.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

🚀 快速上手 LangChain 开发实战:1 小时内掌握《Generative AI with LangChain》的核心!

用户头像
Epsilla
06-27

我们以《Generative AI with LangChain》这本书为私有知识库,通过Epsilla Cloud提供的一站式检索增强生成平台RAGaaS,构建了这本书的学习助手,轻松拿捏LangChain。

轻松两步,借助向量数据库 VectorDB 与千帆 Appbuilder 构建个性化本地问答知识库

在我们日常的工作和生活中,经常会遇到需要快速获取和管理大量信息的情况。无论是解答客户的问题,还是整理公司内部的资料,一个高效的知识库系统都能帮我们省下大量时间和精力。

https://static001.geekbang.org/infoq/18/188cc3c7fbf919e2959b83b314104aa7.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

小鲤 AI 志愿填报助手:一键探索最适合你的大学专业

小鲤AI志愿填报助手利用数据分析和AI技术,帮助高考生做出更明智的专业和学校选择。Newmoney社区使用RAG-GPT开发此工具,以简化复杂的填报过程,提供个性化推荐,并通过技术挑战,展示AI在教育决策中的潜力。

https://static001.geekbang.org/infoq/05/051d0baf860d8bfee9930283e097c882.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 08:使用 Self-RAG 打造高质量、可追溯的 RAG System

编者按: RAG 技术通过检索并利用外部知识源,能够较为有效地提升生成内容的准确性和多样性。然而,经典 RAG 流程也存在一些不足,例如不必要的检索会浪费计算资源,并可能引入无关内容或错误信息,影响生成质量。

https://static001.geekbang.org/infoq/ef/ef1d81eda62f4c2b262fdf08054975f2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Vector | Graph:蚂蚁首个开源 Graph RAG 框架设计解读

引入知识图谱技术后,传统RAG链路到Graph RAG链路会有什么样的变化,如何兼容RAG中的向量数据库(Vector Database)和图数据库(Graph Database)基座,以及蚂蚁的Graph RAG开源技术方案和未来优化方向。

Llama 3 + LangChain + HuggingFace 实现本地部署 RAG(检索增强生成)

本文介绍如何基于Llama 3大模型、以及使用本地的PDF文件作为知识库,实现RAG(检索增强生成)。

https://static001.geekbang.org/infoq/d2/d28815873e9a5b597f2b3debc7356dd4.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 RAG-GPT 集成智谱 AI、DeepSeek 快速搭建 OpenAI Cookbook 智能客服

本文介绍了如何使用RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAI Cookbook智能客服。通过结合索引、检索和生成模块,RAG系统能够提供上下文相关、准确且最新的信息。RAG-GPT项目开源且易于部署,为企业提供了一整套智能客服解决方案。

https://static001.geekbang.org/infoq/91/9186529fee45f85ce8c5493908df6dc8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG-GPT 实践过程中遇到的挑战

本文探讨了RAG-GPT在构建智能客服系统中的挑战与解决方案,详细介绍了RAG系统的优势、核心流程及潜在故障点,并提出了优化策略。OpenIM通过开源RAG-GPT项目,提供高效、智能的客服解决方案,提升用户体验。

https://static001.geekbang.org/infoq/69/69c87b0bbabdf53299eab1d01f4ffb18.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 RAG-GPT 和 Ollama 搭建智能客服

前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服。有些场景,用户可能无法通过往外网访问OpenAI等云端LLM服务,或者由于数据隐私等安全问题,需要本地部署大模型。本文将介绍通过RAG-GPT和Ollama搭建智能客服。

https://static001.geekbang.org/infoq/f3/f3e9f48bbcfeeecd256673f9cd971ff6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

OpenIM Bot: 用 LLM 构建企业专属的智能客服

OpenIM Bot 结合LLM和RAG技术,提供高效智能的用户支持服务。通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升用户体验。

https://static001.geekbang.org/infoq/8e/8ea4e0f1f9ad451f17f48dd882398bd5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

QAnything 1.4.1 中的文档解析

近日,QAnything发布了1.4.1开源版本,我们升级了文档解析模块,支持更精确的回答,支持表格问答,支持答案带配图。本文介绍我们对文档解析的理解,详细处理逻辑,以及最新效果展示。

利用英特尔 Gaudi 2 和至强 CPU 构建经济高效的企业级 RAG 应用

检索增强生成 (Retrieval Augmented Generation,RAG) 可将存储在外部数据库中的新鲜领域知识纳入大语言模型以增强其文本生成能力。其提供了一种将公司数据与训练期间语言模型学到的知识分开的方式,有助于我们在性能、准确性及安全隐私之间进行有效折衷。

基于 Milvus + LlamaIndex 实现高级 RAG

用户头像
Zilliz
05-22

随着大语言模型(LLM)技术的发展,RAG(Retrieval Augmented Generation)技术得到了广泛探讨和研究,越来越多的高级 RAG 检索方法也随之被人发现,相对于普通的 RAG 检索,高级 RAG 通过更深化的技术细节、更复杂的搜索策略,提供出了更准确、更相关、更丰

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 07:在 RAG 系统中进行表格数据处理的新思路

编者按: 目前,检索增强生成(RAG)系统成为了将海量知识赋能于大模型的关键技术之一。然而,如何高效地处理半结构化和非结构化数据,尤其是文档中的表格数据,仍然是 RAG 系统面临的一大难题。

https://static001.geekbang.org/infoq/6f/6f36cf12d1ab3fd12d711104fa330806.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

玩转数据之使用 ElasticSearch 搭建 RAG

在之前的案例视频中我们演示了使用Milvus向量数据库和腾讯向量数据库实现RAG的场景应用。今天我们演示下利用ES的向量数据存储能力来实现RAG,包括三个部分:连接ES数据库并建表;数据写入ES向量数据库流程;问答对话流程。具体操作可参照下面的视频:

https://static001.geekbang.org/infoq/a0/a01bcc615cf662b951779e9d072304f7.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

5 分钟搭建「项目文档问答机器人」

通过 LangChain、FastUI 和 Pluto 构建带有 Web 界面的文档问答机器人,只需要 5 分钟就可以基于你的 GitHub 文档仓库创建一个专属的 Web 问答机器人。

RAG 修炼手册|揭秘 RAG 时代的新向量数据库

用户头像
Zilliz
05-07

随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 05:探讨基于文本内在语义信息的数据分块方法

编者按:在 RAG (Retrieval Augmented Generation) 系统中,将文本数据高效地划分成相对独立且富有语义信息的数据块(chunks)是一项较为关键的任务。基于规则的传统数据分块方法存在一些问题,因此探讨基于文本内在语义信息的数据分块方法非常必要。

文本向量化模型新突破——acge_text_embedding 勇夺 C-MTEB 榜首

国产自研文本向量化模型acge_text_embedding(以下简称“acge模型”)已经在业界权威的中文语义向量评测基准C-MTEB(Chinese Massive Text Embedding Benchmark)中获得了第一名。

RAG 修炼手册|如何评估 RAG 应用?

用户头像
Zilliz
04-23

如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 04:重排序(Re-ranking)技术探讨

编者按:重排序(Re-ranking)技术在检索增强生成(Retrieval Augmented Generation,RAG)系统中扮演着关键角色。通过对检索到的上下文进行筛选和排序,可以提高 RAG 系统的有效性和准确性,为最终的结果生成提供更精准的信息。

提高 RAG 应用准确度,时下流行的 Reranker 了解一下?

用户头像
Zilliz
04-17

检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 03:运用 RAGAs 与 LlamaIndex 评估 RAG 应用

编者按:目前,检索增强生成(Retrieval Augmented Generation,RAG)技术已经广泛使用于各种大模型应用场景。然而,如何准确评估 RAG 系统的性能和效果,一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估,也难以针对性地优化

为什么向量数据库在 RAG 中至关重要?

用户头像
Zilliz
04-11

什么是向量数据库?一个专业的向量数据库究竟是如何运转的?它又是如何为产业赋能的?开箱即用的云原生向量数据库该怎么用?

RAG 修炼手册|一文讲透 RAG 背后的技术

用户头像
Zilliz
04-10

在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战

编者按: 自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。

rag_rag技术文章_InfoQ写作社区