写点什么

rag

0 人感兴趣 · 37 次引用

  • 最新
  • 推荐

文本向量化模型新突破——acge_text_embedding 勇夺 C-MTEB 榜首

国产自研文本向量化模型acge_text_embedding(以下简称“acge模型”)已经在业界权威的中文语义向量评测基准C-MTEB(Chinese Massive Text Embedding Benchmark)中获得了第一名。

RAG 修炼手册|如何评估 RAG 应用?

用户头像
Zilliz
04-23

如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 04:重排序(Re-ranking)技术探讨

编者按:重排序(Re-ranking)技术在检索增强生成(Retrieval Augmented Generation,RAG)系统中扮演着关键角色。通过对检索到的上下文进行筛选和排序,可以提高 RAG 系统的有效性和准确性,为最终的结果生成提供更精准的信息。

提高 RAG 应用准确度,时下流行的 Reranker 了解一下?

用户头像
Zilliz
04-17

检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 03:运用 RAGAs 与 LlamaIndex 评估 RAG 应用

编者按:目前,检索增强生成(Retrieval Augmented Generation,RAG)技术已经广泛使用于各种大模型应用场景。然而,如何准确评估 RAG 系统的性能和效果,一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估,也难以针对性地优化

为什么向量数据库在 RAG 中至关重要?

用户头像
Zilliz
04-11

什么是向量数据库?一个专业的向量数据库究竟是如何运转的?它又是如何为产业赋能的?开箱即用的云原生向量数据库该怎么用?

RAG 修炼手册|一文讲透 RAG 背后的技术

用户头像
Zilliz
04-10

在之前的文章中《RAG 修炼手册|RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要》,我们已经介绍过 RAG 对于解决大模型幻觉问题的不可或缺性,也回顾了如何借助向量数据库提升 RAG 实战效果。

https://static001.geekbang.org/infoq/6b/6b74daaa03b80ed871f477d0580eabea.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战

编者按: 自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。

RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要

用户头像
Zilliz
03-28

Gemini 发布后,由于其在处理长上下文方面表现出色,行业不乏“RAG 已死”的声音。RAG 到底有没有被杀死?向量数据库的还是 AI 应用开发者的最佳拍档吗?本文将一起探讨。

基于大模型和向量数据库的 RAG 示例

RAG是一种先进的自然语言处理方法,它结合了信息检索和文本生成技术,用于提高问答系统、聊天机器人等应用的性能。

RAG 一文读懂!概念、场景、优势、对比微调与项目代码示例

本文结合“基于 ERNIE SDK+LangChain 搭建个人知识库”的代码示例,为您讲解 RAG 的相关概念。

https://static001.geekbang.org/infoq/b0/b072c2b410f3c04638f7c30b2e61f0ab.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RAG 一文读懂!概念、场景、优势、对比微调与项目代码示例

本文结合“基于ERNIE SDK+LangChain搭建个人知识库”的代码示例,为您讲解RAG的相关概念。

揭秘「 B 站最火的 RAG 应用」是如何炼成的

用户头像
Zilliz
02-28

“当我开发出史料检索 RAG 应用,正史怪又该如何应对?” 。

揭秘 LLMs 时代向量数据库的 3 大实用场景

用户头像
Zilliz
02-21

过去一年,ChatGPT 和其他大语言模型(LLMs)的爆火也带动了向量数据库的发展。

https://static001.geekbang.org/infoq/dc/dc95412fd95e1cc87880d2c10ac065dd.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【新手视频】在线快速搭建 AI 原生应用

百度智能云千帆AppBuilder 支持检索增强生成RAG、智能体Agent、智能数据分析GBI等多种应用框架,本文让我们通过视频来了解如何在短短几分钟内轻松构建一个AI原生应用。

手把手系列!无需 OpenAI 即可搭建 RAG 应用

用户头像
Zilliz
01-25

OpenAI 是时下最火爆的大语言模型(LLM),不过除了 OpenAI 以外,还有许多不同的 LLM。此前,我们发布的许多篇文章中都介绍了如何使用 LangChain、Milvus 和 OpenAI 搭建众多 RAG 应用,这次我们来试试不一样的 LLM。

https://static001.geekbang.org/infoq/43/433ed7a7645be4b38f6d9374acce6b49.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

带你手把手玩转【RAG】应用!

RAG应用作为百度智能云千帆AppBuilder上最受欢迎的应用,迎来了大量开发者的使用和体验,在过往一段时间里,很多开发者遇到过回答不准确、命中切片与query不匹配等问题,对此,我们沉淀了几个效果调优tips,帮助您快速诊断并调优您的问答应用效果。如果当前指

https://static001.geekbang.org/infoq/be/be6edf418de1cb2049a3bdbf20e0c4a8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

QAnything 本地知识库问答系统:基于检索增强生成式应用(RAG)两阶段检索、支持海量数据、跨语种问答

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。

如何评估 RAG 应用的质量?最典型的方法论和评估工具都在这里了

用户头像
Zilliz
01-03

随着 LLM(Large Language Model)的应用逐渐普及,人们对 RAG(Retrieval Augmented Generation)场景的关注也越来越多。然而,如何定量评估 RAG 应用的质量一直以来都是一个前沿课题。

有了向量数据库,我们还需要 SQL 数据库吗?

用户头像
Zilliz
2023-12-29

除了向量数据库外,我是否还需要一个普通的 SQL 数据库

5 分钟内搭建一个免费问答机器人:Milvus + LangChain

用户头像
Zilliz
2023-12-21

答案是 5 分钟。只需借助开源的 RAG 技术栈、LangChain 以及好用的向量数据库 Milvus。必须要强调的是,该问答机器人的成本很低,因为我们在召回、评估和开发迭代的过程中不需要调用大语言模型 API。只有在最后一步——生成最终问答结果的时候会调用到 1 次

https://static001.geekbang.org/infoq/12/12404f5796e20fc005c73b97b704cc8c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何优化 RAG 系统的性能表现?10 条实用策略

用户头像
Baihai IDP
2023-12-20

编者按: 检索增强生成(RAG)系统最近备受关注,ChatGPT的火爆更让这类系统成为广泛讨论的热点。我们今天为大家带来的这篇文章,作者Matt Ambrogi的核心观点是:构建一个基本可用的RAG系统非常简单,但要使其达到实际生产可用的程度则异常困难,需要我们投入大

你真的会写 Prompt ? 剖析 RAG 应用中的指代消解

用户头像
Zilliz
2023-12-19

随着 ChatGPT 等大语言模型(LLM)的不断发展,越来越多的研究人员开始关注语言模型的应用。

https://static001.geekbang.org/infoq/06/06e2073f4c3f9b8c68251b9627a881cd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

HuggingFists- 低代码玩转 LLM RAG(2) Query

用户头像
数由科技
2023-12-14

继上一篇文章我们探讨了如何使用HuggingFists实现文本的Embedding后。这一次我们将介绍如何使用HuggingFists实现LLM RAG的查询部分。

https://static001.geekbang.org/infoq/9b/9b78df188e58b3da807fe121d270b33e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

7 种查询策略教你用好 Graph RAG 探索知识图谱

用户头像
NebulaGraph
2023-12-06

我们在这篇文章中探讨了知识图谱,特别是图数据库 NebulaGraph,是如何结合 LlamaIndex 和 GPT-3.5 为 Philadelphia Phillies 队构建了一个 RAG。

https://static001.geekbang.org/infoq/9f/9fc2b17e8d69296ea20248253a368daf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大型语言模型在实体关系提取中的应用探索

用户头像
数由科技
2023-12-04

​介绍了一种使用LLM进行实体关系识别的方法与思考

https://static001.geekbang.org/infoq/c7/c73fbbdbba952781fc95c9f238a51acf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

HuggingFists- 低代码玩转 LLM RAG(1) Embedding

用户头像
数由科技
2023-12-02

伴随着LLM日新月异的发展,业界对与LLM的落地思考逐渐聚焦到到两个方向上。一是RAG(Retrieval-Augmented Generation),检索增强生成;一是Agents, 智能体。我们这个系列的文章也将围绕这两个应用方向介绍如何使用HuggingFists进行落地实现。其社区版可通过

rag_rag技术文章_InfoQ写作社区