写点什么

云栖实录 | 阿里云助力金山办公打造智能搜索新标杆:WPS 云文档搜索技术全面升级

  • 2025-10-28
    浙江
  • 本文字数:1194 字

    阅读完需:约 4 分钟

随着大模型时代到来,用户需求从“关键词匹配”转向“自然语言交互与问答式搜索”。2025 年 9 月 26 日,杭州云栖大会“AI 搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品 WPS 云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入 3.0 时代。


此次升级以阿里云 Elasticsearch 混合检索与 AI 语义搜索能力为核心,全面解决海量文档场景下的检索效率、语义理解与成本优化难题,为全球 6.32 亿月活用户提供“秒级响应、语义直达”的智能搜索体验。


关于金山办公

金山办公(Kingsoft Office)是全球领先的办公软件、服务与解决方案提供商,旗下产品包括 WPS Office、金山文档等,服务全球超 6.32 亿月活用户,覆盖 220 多个国家和地区,致力于以技术创新推动办公智能化转型。


深耕技术迭代:从基础架构到语义搜索的跨越

作为拥有 2625 亿云文档、服务全球 220 余个国家和地区的企业级应用,WPS 云文档搜索功能历经三次技术革新。早期版本面临“搜不到、排不准、响应慢”等挑战:1.0 版本通过自研 QU 引擎、分词器及高亮算法,将首屏点击率从 53.7%提升至 69.8%,MRR(平均倒数排名)翻倍至 0.52;2.0 版本依托阿里云 ES 索引优化、跨集群网关等技术,实现查询 P99 延迟<350ms,集群稳定性显著提升,支撑千亿级文档规模下的高效检索。


金山办公云搜索技术总监陈海荣指出:“用户不再局限于文件名检索,而是希望输入‘项目 Q3 营收数据’或‘公司规章制度’等语义指令,直接获取结构化答案。”这一转变推动 WPS 搜索进入 3.0 时代。

阿里云技术赋能:混合检索与 AI 原生架构

在 3.0 版本中,金山办公联合阿里云 Elasticsearch 构建“语义搜索+向量检索”的混合技术架构,实现三大突破:

  1. 文档 AI 原生化:通过多维度 AI 解析引擎,对文档内容进行语义标签化处理,提升文档理解深度;


  1. Query 意图精准识别:基于大模型的自然语言处理能力,实现搜索意图分流,支持“全库问答”“文档关联检索”等场景;

  2. 冷热数据智能管理:依托阿里云 ES 冷热索引策略,将向量检索内存资源需求降低 70%、CPU 消耗减少 50,同时通过自动化的写入/查询 Pipeline,实现业务无感的高效成本控制。


以实际场景为例,用户输入“新人如何申请休假”时,系统可自动关联公司制度文档并提取关键流程;输入“项目 A 季度总结”时,AI 直接从相关文档中抽取数据生成摘要,真正实现“告别盲找,一步直达答案”

未来展望:AI 搜索生态的全球布局

金山办公与阿里云的深度合作,不仅优化了搜索技术架构,更重塑了智能办公场景的用户体验。未来,双方计划进一步融合多模态检索、实时协同搜索等能力,并拓展至企业知识库管理、跨语言文档检索等全球化场景。


“阿里云 Elasticsearch 的混合检索能力与技术前瞻性,是支撑 WPS 搜索持续领先的关键。”陈海荣表示。作为企业级搜索领域的标杆案例,WPS 云文档的技术升级为行业提供了可复用的智能化升级路径——从底层架构优化到上层语义交互创新,阿里云持续以“技术+场景”双轮驱动,赋能企业构建下一代智能搜索生态。

用户头像

还未添加个人签名 2020-10-15 加入

分享阿里云计算平台的大数据和AI方向的技术创新和趋势、实战案例、经验总结。

评论

发布
暂无评论
云栖实录 | 阿里云助力金山办公打造智能搜索新标杆:WPS云文档搜索技术全面升级_elasticsearch_阿里云大数据AI技术_InfoQ写作社区