写点什么

云栖实录 | 阿里云发布 Elasticsearch Serverless 2.0,重塑 AI 搜索时代基础设施

  • 2025-10-30
    浙江
  • 本文字数:1385 字

    阅读完需:约 5 分钟

2025 年 9 月 26 日,在杭州云栖大会“AI 搜索与向量引擎”分论坛上,阿里云智能集团高级技术专家——贾新禹正式发布 Elasticsearch Serverless 2.0,并首次系统性阐述其技术架构与产品价值。这一全新升级的 Serverless 解决方案,以“极致弹性、智能核心、AI 生态融合”三大技术基石,直面 AI 搜索时代的工程化挑战,为企业提供一站式构建 AI 搜索能力的基础设施。

时代鸿沟:AI 搜索需求升级与工程落地的矛盾

贾新禹指出,随着语义搜索、多模态检索等能力从“加分项”变为行业标配,企业面临着一道显著的工程鸿沟:开发者不仅要满足高性能、低成本的业务需求,还必须投入大量资源到模型调优、量化算法设计、混合排序等全新的复杂领域,这直接导致开发周期漫长、运维成本高昂。Elasticsearch Serverless 2.0 的核心使命,就是通过将这些技术复杂度封装至底层,让开发者能够回归业务创新


极简AI搜索实战演示 >>

技术基石一:极致弹性基座,持续进化的核心能力

Elasticsearch Serverless 2.0 其核心之一,是为用户提供了一个“极致弹性、持续进化”的 Serverless 基座,让企业无需关注底层版本迭代,即可无缝获取最新能力。

  • 极致弹性:通过将弹性调度下沉至引擎,实现了亚秒级弹性响应。面对流量洪峰,服务平稳无抖动,确保业务连续性。

  • 无感进化:无感集成社区与阿里云最新技术特性。例如,引入 ES 9 的 FilterKNN 优化,使向量检索性能提升 5 倍;采用 Lucene 10 的 Merge 算法,让 Merge 性能提升 2 倍;目前已集成超 30 个 817 以上版本新特性。

  • 深度优化:基于云环境持续进行软硬件协同优化。例如,通过与 JDK 及倚天团队合作,针对 int8 量化查询性能分别提升了 30% 和 50%



技术基石二:内置专家经验的智能核心,化繁为简

针对搜索系统调优门槛高的痛点,Serverless 2.0 内置了智能核心引擎,将专家经验产品化。


  • 智能策略自动调优:内置专家级优化策略,如自动在 _source 中排除向量字段、默认启用 int8 量化,在保障核心召回精度的同时,可节省 70% 的存储和 75% 的内存

  • 专家级智能 Agent:基于 LangGraph 实现的智能 Agent,能复刻专家经验。例如,它能智能推断 RDS 中的 int 类型字段 delete_status 为状态字段,并自动优化为更利于过滤和聚合的 keyword 类型。

  • 查询模板自动生成:Agent 能根据业务场景,自动生成复杂的查询模板。例如,在商品检索场景下,可一键生成融合了文本、向量、多模态的三路 RRF 查询模板,大幅降低新技术使用门槛。


技术基石三:AI 生态深度整合,端到端能力全托管

Elasticsearch Serverless 2.0 进一步打通阿里云 AI 搜索生态,构建端到端 AI 搜索闭环开发者无需再拼凑和运维分散的 AI 服务


  • 无缝集成 AI 平台:无缝集成阿里云 AI 搜索开放平台,提供丰富的搜索专属大模型。这并非通用模型,而是经过大量真实搜索场景打磨的专属模型,让检索和生成效果更专业。

  • 零运维的向量链路:平台提供从数据导入、向量化、索引构建到查询生成的全链路托管,让开发者无需关心复杂的向量链路搭建与运维。

未来展望:Serverless 2.0 让业务回归业务

贾新禹总结称,Elasticsearch Serverless 2.0 的核心价值在于通过将弹性、调优和 AI 能力彻底平台化,让企业能从繁重的工程细节中解放出来,真正聚焦于业务创新。这不仅是一次技术升级,更是对开发者生产力的一次彻底解放,将有力推动 AI 搜索技术的普惠化应用。


用户头像

还未添加个人签名 2020-10-15 加入

分享阿里云计算平台的大数据和AI方向的技术创新和趋势、实战案例、经验总结。

评论

发布
暂无评论
云栖实录 | 阿里云发布Elasticsearch Serverless 2.0,重塑AI搜索时代基础设施_elasticsearch_阿里云大数据AI技术_InfoQ写作社区