写点什么

疫情之后规模最大!武汉站 Meetup,腾讯云与 Elastic 共绘 ES 在 AI 时代搜索技术新蓝图!

  • 2024-06-13
    广东
  • 本文字数:5521 字

    阅读完需:约 18 分钟

疫情之后规模最大!武汉站Meetup,腾讯云与Elastic共绘ES在AI时代搜索技术新蓝图!

导读

武汉,2024 年 3 月 30 日 — 在这个春意盎然的季节,由腾讯云和 Elastic 社区联合主导的,Elastic Meetup 武汉站活动成功在汤逊湖畔,腾讯武汉研发中心举办,标志着疫情后最大规模的 Elastic Meetup 的圆满结束。这次活动不仅是技术交流的盛宴,更是腾讯云 ES 在当前火热的 AI、向量搜索领域深耕细作的一个缩影,也是腾讯云与 Elastic 社区紧密合作的生动体现。


活动概览

在这次技术 Meetup 上,我们迎来了超过两百位热情的技术爱好者报名参与,其中近百位现场参与者共同体验了一场关于 Elastic 技术的深度探讨。五位来自不同领域的资深专家带来了他们的见解和经验分享,让与会者获得了丰富的知识和启发。

图一

首先,Elastic 社区的首席布道师刘晓国为我们揭开了《Elasticsearch 简单而高效的管道查询语言 - ES|QL》的神秘面纱,让大家对 ES|QL 的强大功能和简洁语法有了全新的认识。

接着,腾讯云 ES 的高级研发工程师刘忠奇深入讲解了《腾讯云 ES 结合 AI 场景的实践与探索》,展示了腾讯云 ES 和 AI 技术碰撞时,能擦出怎样的火花。

紧随其后的是 Elastic 的首席解决方案架构师李捷,他带来了《未来运维之道:Elastic AI 助手的高效运维与数据智能》,分享了如何利用 Elastic AI 助手提升运维效率和数据处理智能。

小米的高级研发工程师周明裕则聚焦于《小米在 Elasticsearch 服务成本治理的实践》,分享了小米如何有效地管理和优化 Elasticsearch 服务的成本,为企业节省资源。

最后,绿盟科技的技术专家陆攀带来了《ES 在绿盟企业安全平台的应用实践》,讲述了 Elasticsearch 在企业安全领域的应用案例,为与会者提供了宝贵的行业洞察。

整个活动井然有序,每一场演讲都是对知识的一次深度挖掘,与会者在热烈的交流中获得了不仅是技术的更新,更有对未来趋势的洞见。


腾讯云 ES 和 AI 的技术碰撞

腾讯云作为本次活动的承办和主导方,不仅提供了宽敞且舒适的会议场地,还将腾讯云 ES 在 AI 场景、向量搜索上的领先优势在本次 Meetup 中进行了充分的展示。在腾讯工程师刘忠奇的精彩演讲中,我们深入了解了腾讯云 ES 如何与 AI 技术相结合,探索和实践新的可能性。他分享了腾讯云 ES 结合 AI 场景的多个先进实践案例,对 RAG、混合搜索等 AI 场景的技术,如何在腾讯云 ES 落地实践进行了深入的解读。他还详细介绍了腾讯云 ES 的 8.11.3 版本在 AI 能力方面的优势,以及在 AI 运维诊断专家系统(AIOps、LLMOps)方面的最新进展。这些技术的应用不仅凸显了腾讯云在技术革新方面的深厚底蕴,也为与会者呈现了一场关于未来技术发展趋势的思考与启迪。

图二

技术焦点:

腾讯云 ES 的 AI 和向量搜索能力

一、腾讯云 ES 结合 AI 实现混合搜索实战演练

开箱即用的向量搜索体验

腾讯云 ES 提供了从模型上传、向量生成、向量存储、向量检索的一站式解决方案,将传统的基于关键词的文本检索,扩展到基于图索引的多模态搜索,帮助高效构建搜索系统、问答系统、推荐系统、内容审核等应用场景。

图三

具体而言,腾讯云 ES 的向量搜索能力继承了用户熟悉的数据写入方式,通过 Elasticsearch 新推出的推理管道功能——Inference Pipeline,一个新型的 Ingest Pipeline,保持了数据处理的连贯性。当数据写入时指定 Inference Pipeline,JSON 格式的数据会在索引前自动通过指定的机器学习模型推理出向量表示,从而在原始数据上扩展出向量字段,无缝整合传统搜索与 AI 的强大功能。

同时,腾讯云 ES 支持开箱即用的 ELSER 模型,以及快速上传部署自定义模型或 Hugging Face 上的模型,使得用户可以轻松导入和管理机器学习模型,享受一站式向量搜索服务。


一站式 RAG 解决方案

值得一提的是,腾讯云 ES 提供的一站式 RAG 解决方案,提供了 RAG 应用范围内的所有功能,超越了传统向量数据库所提供的单点解决方案范围,例如,支持通过文本+向量的混合搜索能力,灵活应对各种需求;在打分上,ES 支持通过设置文本、向量的权重,甚至字段级别的词权重,进行打分排序,或者是直接使用内置的 RRF 能力,直接实现混合打分、排序,后续也支持通过引入 LTR 模型,对粗排结果进行重排,满足不同业务场景的需求,同时,也支持直接上传自定义 embedding 模型,或者 hugging face 上的 embedding 模型,在 ES 内部完成模型管理、部署、数据向量化等。

图四


向量搜索实战演练

在我们的向量搜索快速实战演练文章中,展示了如何在短短 10 分钟内体验腾讯云 ES 的向量搜索功能。搜索请求的语法简洁,只需指定向量字段和文本向量化的机器学习模型。搜索响应揭示了向量搜索与全文搜索的根本区别:向量搜索基于空间距离相似度评分,而全文搜索则依赖于 TF/IDF、BM25 等基于词频的算法。

腾讯云 ES 向量搜索实战演练文章:

《「最佳实践」腾讯云 Elasticsearch 8:预训练模型与一站式向量化语义检索的完美结合》

《腾讯云ES AI增强搜索:十分钟快速入门自然语言处理(NLP)与向量检索》

图五


混合搜索实战演练

尽管向量搜索可以实现语义上的查询,但它并非完美无缺。例如,在处理特定字符串如“8XLARGE64”时,向量搜索召回的帮助文档实际是不相关的,所以大语言模型无法根据召回的知识信息进行推理、回答。而这类查询在文本搜索中可以轻而易举的召回,这时,结合向量搜索和文本搜索的优势,混合搜索便显得尤为重要。混合搜索是,将同样的检索内容,分别使用向量搜索和文本搜索的方式进行查询,再对这两路召回结果进行合并,这样一种提升召回率的搜索方式。腾讯云 ES 8.11.3 版本支持一站式混合搜索,能够在单次查询中同时执行文本和向量搜索,并自动对多路召回的结果进行排序融合。

图六


混合搜索的 RAG 最佳实践案例

RAG 的全称是 Retrieval Augmented Generation,顾名思义,通过检索的方法来增强生成模型的能力。腾讯云 ES 在 RAG 的混合搜索技术方向,已经走在前列。我们的系列文章,深入浅出地展现了这项技术的便捷性和准确性。

腾讯云 ES RAG 系列文章:

《Elasticsearch案例:百行代码实现腾讯ES帮助文档的RAG》《Elasticsearch RAG案例:混合搜索的相关性调优》

在面向客户的实战案例中,腾讯云 ES 8.11.3 的推出极大地简化了客户原有的混合搜索架构。通过在 ES 的 DSL 中直接使用 RRF(Reciprocal Rank Fusion)算法,实现了一站式的多路召回,并对结果排序融合,这不仅大幅简化了架构,同时也实现了成本的显著降低。利用 ES 作为搜索引擎,我们可以通过最简化的架构实现混合搜索,然后采用 Prompt 工程将问题与混合搜索召回的答案结合起来,交由大型模型进行推理与总结,最终提供精确的解答。ES 结合了向量搜索的混合搜索,展现了在 AI 时代搜索技术的真正价值和竞争力。

图七

在另一个面向客户的实战案例中,腾讯云 ES 在混合搜索方面的应用面临着更高的召回率、成本和性能要求。

在 RAG 的基础流程上,我们引入了两个关键的优化步骤。首先,在数据写入之前,利用大型模型对原始文档的超长文本进行总结和精炼,然后将这些数据输入 ES 的推理管道,生成用于混合搜索的索引。这种方法不仅保持了合理的索引大小,控制了成本,还提升了召回质量。在执行 RAG 时,我们采用了前沿的 RAG-Fusion 理念,通过问题扩充形成更多路的查询,并利用 RRF 原理进一步提升召回率。

在性能调优方面,我们的技术实践也是全面而深入的。通过应用《十亿级高性能向量检索最佳实践》中提到的性能调优策略,我们为客户提升了性能,确保了系统的稳定性,满足了客户 To C 场景下对高性能混合搜索的严格要求。

图八

此外,腾讯云 ES 的独有能力在全文搜索和混合搜索方面都得到了充分的展示。例如,通过上传自定义词典来优化召回率,支持 QQ 分词器等功能,为用户提供了更加精准和高效的搜索体验。这些能力的整合,不仅体现了腾讯云 ES 在技术深度上的积累,也展示了其在提供高价值搜索解决方案方面的实力。

图九

二、AI 诊断专家的探索与实践

在 AIOps、LLMOps 这些前沿领域,腾讯云 ES 提出并实践了“AI 诊断专家”这一概念。通过专门的代码能力训练,大模型已经具备了对开源项目源码的深层理解,这使得它能够进行专家级别的分析。我们向 GPT-4 提出了是否能够成为 Elasticsearch 诊断专家的问题,而大模型不仅给出了肯定的答复,还展示了通过类名和方法名关联代码知识库,分析源码上下文,理解代码功能及潜在问题的能力。

利用当前领先的大语言模型框架 LangChain,并借鉴 ReAct 型 Agent 智能体的典型流程,腾讯云 ES 成功实现了 AI 诊断专家的原型。在我们的 demo 中,AI 诊断专家通过发起 REST 请求,自动分析 ES 集群状态变为 yellow 的根本原因,并将其推理过程逐步展现。

每一轮的思考都是 AI 诊断专家对当前问题的精准总结,通过概念拆解、反思和推理,逐步构建出工具执行计划。在两次 REST 请求后,AI 在第三轮思考中成功诊断出问题的根因,并结束了分析。基于前面提到的 Agent 智能体的流程,这些思考过程可以作为短时记忆,为 AI 提供了进一步总结和精简结论的基础。通过打印完整的思考过程,我们验证了 AI 的推理是否准确。在这个简化的场景中,AI 未被提供任何额外信息,但通过层层逻辑推理,精确地调用工具并获取关键信息,完成了问题分析。

图十

在难度更高的下一个 demo 中,我们挑战 AI 诊断集群 CPU 异常的原因。人类专家通常会借助火焰图工具分析堆栈,找出占用 CPU 的热点函数。我们也为 AI 诊断专家引入了火焰图分析工具,以观察其是否能有效使用此工具。

AI 诊断专家在第一轮思考中使用 REST 请求工具获取了当前的任务列表,并从中发现了可能导致高耗时的 wildcard 查询任务。在第二轮中,AI 调用火焰图工具,确认了 org/apache/lucene/search/WildcardQuery.函数占用了 96%的高 CPU 比例,这进一步支持了其初步推测。在第三轮中,AI 进行了总结性思考,认为已找到 CPU 飙升的根本原因,并结束了分析。

在这个复杂场景中,AI 通过扩展可用工具集,依然能够通过层层推理,准确调用工具并获取关键信息,完成问题分析。这表明,只要提供足够的工具集,AI 诊断专家就有能力自动完成复杂的 ES 集群运维根因分析。

图十一

通过这两个 demo 的验证,我们可以得出结论:工具集越丰富,AI 诊断专家的分析能力就越强,能处理的场景就越全面。将优秀的根因分析案例作为知识库输入到 ES 中,形成 RAG 的知识库,可以进一步指导 AI 进行更为精准的分析诊断。随着运维的集群数量增加,AI 诊断专家的价值愈发凸显。例如,在腾讯云 ES 上运行的数以万计的集群,AI 的应用可以大幅节省运维人力资源。随着知识库的不断更新和训练,大语言模型的推理能力也将得到进一步增强。

除了 ES,其他开源复杂系统也可以采用这一方案,成功的经验可以迅速复制和推广。这意味着 AI 诊断专家不仅能够在特定的领域内,如同一位真正的技术专家一样,不断提升自身的技术能力,而且还能在业务层面为腾讯云 ES 提供支持,协助甚至在某些方面“取代”人类专家。

腾讯云 ES 将继续加大在 AI 领域的投入,推动这些技术的实际应用,以便真正服务于我们的客户。通过这种方式,AI 诊断专家的未来展望将不仅限于技术层面的提升,更将在商业价值和服务质量上实现质的飞跃。

图十二

总结而言,腾讯云 ES 的 AI 诊断专家展现了 AI 与运维领域结合的巨大潜力。通过不断学习和适应,AI 不仅能够理解复杂的技术问题,还能够自动化地提供解决方案,这在提高效率、降低成本和推动技术创新方面具有重要意义。随着技术的进步和应用的深化,我们有理由相信,AI 将在未来的 IT 运维领域扮演越来越重要的角色。

三、腾讯云 ES 8.11.3 版本 AI 能力解读

腾讯云 ES 8.11.3 版本在向量搜索领域迈出了重要一步,支持的向量维度大幅提升至 4096 维,这一跃升不仅拓宽了向量搜索的应用场景,也为高维数据提供了更为丰富的表征空间。同时,8.11.3 版本新增的 nested mapping 支持,为 RAG 知识库场景下做 chunk 文本分块提供了强有力的技术支撑。

图十三

通过融合腾讯自研的 KonaJDK 21,腾讯云 ES 得以利用 SIMD 数据并行技术,实现向量计算性能的显著提升,高达 30%的性能增幅,为用户的搜索和分析任务带来了更为流畅和高效的体验。

图十四

腾讯云 ES 8.11.3 版本还首次支持了 Elastic AI Assistant 功能的体验,这一创新功能将 AI 辅助能力带入搜索分析和运维过程,进一步提升了智能化水平,为用户带来前所未有的便捷。

图十五

此外,腾讯云 ES 的功能整合能力得到了进一步加强,支持 ES 内置的 ELSER 模型的开箱即用,同时也支持 HuggingFace 和本地模型的上传,为用户提供了更为灵活和强大的模型应用能力。

图十六

腾讯云 ES 的专用机器学习节点,为用户提供了一站式的向量生成和检索服务。这一设计不仅有效提升了向量推理能力,还确保了数据节点的隔离,保障了在线检索业务的稳定性。

图十七

腾讯云 ES 在 AI 和向量搜索领域的发展步伐紧跟社区的最新动态。自 2023 年 7 月份发布了腾讯云 ES 8.8.1 版本,到 2024 年 1 月份上线的 8.11.3 版本,腾讯云 ES 不断引入最新能力。在接下来的版本中,我们可以期待如 Learn-to-rank 的支持、外部模型 API 的推理能力,以及 FMA 融合乘加、密集向量类型 int8 量化段间信息共享等技术,这些都极大地提升了向量搜索的功能和性能。

图十八

总结来说,在 AI 和向量搜索领域的热潮中,腾讯云 ES 不仅走在了行业前列,更承诺将持续提升 ES 在 AI 场景中的应用体验。无论是在技术深度还是技术价值上,腾讯云 ES 都是您在 AI、向量搜索场景的不二选择!

结语

本次 Elastic Meetup 武汉站的成功举办,得益于腾讯云与 Elastic 社区的紧密合作。腾讯云不仅提供了优越的会议场地,更在活动筹备和宣传上投入了大量资源。腾讯云的积极参与,不仅体现了其对技术社区的支持,也展现了其作为技术领导者的责任感和使命感。

随着活动的圆满结束,我们对参与者的热情和对技术的追求表示由衷的感谢,也不禁期待未来腾讯云与 Elastic 社区能够带来更多这样的交流机会。通过这些活动,不仅能够促进技术的交流与合作,更能推动整个行业的创新和发展,为参与者提供了一个宝贵的学习和交流平台。让我们共同期待,腾讯云与 Elastic 社区将如何继续携手,为我们带来更多技术的惊喜。

如需了解更多关于腾讯云 ES 的信息,请访问我们的官方网站:腾讯云 ES 官网

我们期待与您的相遇,共同探索 AI 时代搜索技术的无限可能。

用户头像

还未添加个人签名 2020-06-19 加入

欢迎关注,邀您一起探索数据的无限潜能!

评论

发布
暂无评论
疫情之后规模最大!武汉站Meetup,腾讯云与Elastic共绘ES在AI时代搜索技术新蓝图!_ES_腾讯云大数据_InfoQ写作社区