rag
0 人感兴趣 · 59 次引用
- 最新
- 推荐
检索生成 (RAG) vs 长文本大模型:实际应用中如何选择?
编者按:大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术:长上下文(Large Context Windows)和检索增强生成(RAG)。这两种技术各有何优势?在实际应用中,我们又该如何权衡选择?
Advanced RAG 09:『提示词压缩』技术综述
编者按: 如何最大限度地发挥 LLMs 的强大能力,同时还能控制其推理成本?这是当前业界研究的一个热点课题。
轻松两步,借助向量数据库 VectorDB 与千帆 Appbuilder 构建个性化本地问答知识库
在我们日常的工作和生活中,经常会遇到需要快速获取和管理大量信息的情况。无论是解答客户的问题,还是整理公司内部的资料,一个高效的知识库系统都能帮我们省下大量时间和精力。
小鲤 AI 志愿填报助手:一键探索最适合你的大学专业
小鲤AI志愿填报助手利用数据分析和AI技术,帮助高考生做出更明智的专业和学校选择。Newmoney社区使用RAG-GPT开发此工具,以简化复杂的填报过程,提供个性化推荐,并通过技术挑战,展示AI在教育决策中的潜力。
Advanced RAG 08:使用 Self-RAG 打造高质量、可追溯的 RAG System
编者按: RAG 技术通过检索并利用外部知识源,能够较为有效地提升生成内容的准确性和多样性。然而,经典 RAG 流程也存在一些不足,例如不必要的检索会浪费计算资源,并可能引入无关内容或错误信息,影响生成质量。
Vector | Graph:蚂蚁首个开源 Graph RAG 框架设计解读
引入知识图谱技术后,传统RAG链路到Graph RAG链路会有什么样的变化,如何兼容RAG中的向量数据库(Vector Database)和图数据库(Graph Database)基座,以及蚂蚁的Graph RAG开源技术方案和未来优化方向。
使用 RAG-GPT 集成智谱 AI、DeepSeek 快速搭建 OpenAI Cookbook 智能客服
本文介绍了如何使用RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAI Cookbook智能客服。通过结合索引、检索和生成模块,RAG系统能够提供上下文相关、准确且最新的信息。RAG-GPT项目开源且易于部署,为企业提供了一整套智能客服解决方案。
RAG-GPT 实践过程中遇到的挑战
本文探讨了RAG-GPT在构建智能客服系统中的挑战与解决方案,详细介绍了RAG系统的优势、核心流程及潜在故障点,并提出了优化策略。OpenIM通过开源RAG-GPT项目,提供高效、智能的客服解决方案,提升用户体验。
使用 RAG-GPT 和 Ollama 搭建智能客服
前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服。有些场景,用户可能无法通过往外网访问OpenAI等云端LLM服务,或者由于数据隐私等安全问题,需要本地部署大模型。本文将介绍通过RAG-GPT和Ollama搭建智能客服。
OpenIM Bot: 用 LLM 构建企业专属的智能客服
OpenIM Bot 结合LLM和RAG技术,提供高效智能的用户支持服务。通过优化向量存储、混合检索和查询分析,解决了LLM的幻觉、新鲜度、token长度和数据安全问题,提升用户体验。
QAnything 1.4.1 中的文档解析
近日,QAnything发布了1.4.1开源版本,我们升级了文档解析模块,支持更精确的回答,支持表格问答,支持答案带配图。本文介绍我们对文档解析的理解,详细处理逻辑,以及最新效果展示。
基于 Milvus + LlamaIndex 实现高级 RAG
随着大语言模型(LLM)技术的发展,RAG(Retrieval Augmented Generation)技术得到了广泛探讨和研究,越来越多的高级 RAG 检索方法也随之被人发现,相对于普通的 RAG 检索,高级 RAG 通过更深化的技术细节、更复杂的搜索策略,提供出了更准确、更相关、更丰
Advanced RAG 07:在 RAG 系统中进行表格数据处理的新思路
编者按: 目前,检索增强生成(RAG)系统成为了将海量知识赋能于大模型的关键技术之一。然而,如何高效地处理半结构化和非结构化数据,尤其是文档中的表格数据,仍然是 RAG 系统面临的一大难题。
玩转数据之使用 ElasticSearch 搭建 RAG
在之前的案例视频中我们演示了使用Milvus向量数据库和腾讯向量数据库实现RAG的场景应用。今天我们演示下利用ES的向量数据存储能力来实现RAG,包括三个部分:连接ES数据库并建表;数据写入ES向量数据库流程;问答对话流程。具体操作可参照下面的视频:
5 分钟搭建「项目文档问答机器人」
通过 LangChain、FastUI 和 Pluto 构建带有 Web 界面的文档问答机器人,只需要 5 分钟就可以基于你的 GitHub 文档仓库创建一个专属的 Web 问答机器人。
RAG 修炼手册|揭秘 RAG 时代的新向量数据库
随着对大型模型应用探索的深入,检索增强生成技术(Retrieval-Augmented Generation)受到了广泛关注,并被应用于各种场景,如知识库问答、法律顾问、学习助手、网站机器人等。
Advanced RAG 05:探讨基于文本内在语义信息的数据分块方法
编者按:在 RAG (Retrieval Augmented Generation) 系统中,将文本数据高效地划分成相对独立且富有语义信息的数据块(chunks)是一项较为关键的任务。基于规则的传统数据分块方法存在一些问题,因此探讨基于文本内在语义信息的数据分块方法非常必要。
RAG 修炼手册|如何评估 RAG 应用?
如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?
Advanced RAG 04:重排序(Re-ranking)技术探讨
编者按:重排序(Re-ranking)技术在检索增强生成(Retrieval Augmented Generation,RAG)系统中扮演着关键角色。通过对检索到的上下文进行筛选和排序,可以提高 RAG 系统的有效性和准确性,为最终的结果生成提供更精准的信息。
提高 RAG 应用准确度,时下流行的 Reranker 了解一下?
检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。
Advanced RAG 03:运用 RAGAs 与 LlamaIndex 评估 RAG 应用
编者按:目前,检索增强生成(Retrieval Augmented Generation,RAG)技术已经广泛使用于各种大模型应用场景。然而,如何准确评估 RAG 系统的性能和效果,一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估,也难以针对性地优化
Advanced RAG 01:讨论未经优化的 RAG 系统存在的问题与挑战
编者按: 自 2023 年以来,RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG,优化其性能、提高检索效率和准确性迫在眉睫,成为当前 RAG 相关研究的核心问题。