Elasticsearch filter context 的实践案例
data:image/s3,"s3://crabby-images/15f57/15f57722519fb58aa411cf6ffd886bda12d22e0b" alt="Elasticsearch filter context 的实践案例"
知识背景
在 ES 查询优化的建议里,很多时候为了避免算分逻辑和利用缓存逻辑,Elastic 会建议大家使用 filter 条件。
filter 的使用条件和原理具体可以参照之前写的博文《Elasticsearch filter context 的使用原理》
这里我们来研究 2 个实用案例,具体的感受一下 filter context 的使用效果。
普通案例
第一个案例,我们选择一个 range date 的条件进行测试环境测试,将其中 must 条件改成 filter 条件,测试 5 次以上,观测其缓存数据。
可以看到 query_cache 的 size/count 始终为 0,也就是并没有利用到缓存。
data:image/s3,"s3://crabby-images/0bc66/0bc66f99195b7e297100dfb5e44dcce68b0eb65e" alt=""
查询的耗时也维持在 900-1100ms 左右。
data:image/s3,"s3://crabby-images/9b697/9b69768973b8c4db5ba694383186bc83e7a9815d" alt=""
再测试 filter 条件
在重复的查询过程中,查询速度有明显的加快。
data:image/s3,"s3://crabby-images/2c59c/2c59c158aac36c4c39f9b31f655e398f27516368" alt=""
多次查询之后
data:image/s3,"s3://crabby-images/b6f5f/b6f5f227a2d528146a60056767255d98c156fbe9" alt=""
查看 query_cache size/count 有明显的使用。
data:image/s3,"s3://crabby-images/25792/25792377fb04d9b9c704198d1f8c9ce12c106c4e" alt=""
使用误区
那是不是所有的 filter 就会加速呢?再看下面这个查询
must 方法
data:image/s3,"s3://crabby-images/29d5d/29d5de1fe2a8834c1746c1c7f2eb748865ddd89a" alt=""
filter 方法
data:image/s3,"s3://crabby-images/8bb90/8bb90107b90013089b6a51fc510af7d3597b1ed4" alt=""
可以看到 2 个查询条件多次查询后,查询耗时差别不大。
并且都产生了 query cache 的使用。
must 条件
data:image/s3,"s3://crabby-images/5cba2/5cba2aca5f9dfac2850260cb6352fb813035e4e5" alt=""
filter 条件
data:image/s3,"s3://crabby-images/a412b/a412b290f4f8492f522b94fe37e8debd1315672c" alt=""
难道这两个查询都成了 filter context 查询?既然 filter context 的判断依据之一是查询条件是否算分,就可以使用 "explain": true 进行进一步分析。
must 方法
data:image/s3,"s3://crabby-images/c3241/c3241ce68565d7a0199b9c9a70f5336a8dd7b596" alt=""
filter 方法
data:image/s3,"s3://crabby-images/62f41/62f4176ae9454e7579792b89b16d2f5fa3e56822" alt=""
可以看到查询方法在 ES 这里做了隐性的转换。这两个查询对应的底层查询方法为 ConstantScore,而 ConstantScore 也是可以被认为是 filter context 的一种。因此这里的 must 查询也达到 filter 查询使用 querycache 的优势。
校验思路
data:image/s3,"s3://crabby-images/8baf5/8baf52c2c0a1c9e314d1a1ee2837bb4caba49bf8" alt=""
cache 数据
也可以通过简单安装一个 INFINI Console(https://docs.infinilabs.com/console/main/docs/getting-started/install/) 进行图表监控(在监控图表-索引-advance 中)
data:image/s3,"s3://crabby-images/dcc36/dcc36c94c9ec326d2e9353e96f306501e38caff9" alt=""
查询使用的算分方法利用 explain API 判断查询语句是否转换成符合 filter context 的类型,比如是否转换成了 constant score,或者算分规则被消除了,等等
作者:金多安,极限科技搜索运维专家,Elastic 认证专家,搜索客社区日报责任编辑。一直从事与搜索运维相关的工作,日常会去挖掘 ES / Lucene 方向的搜索技术原理,保持搜索相关技术发展的关注。
原文:https://infinilabs.cn/blog/2024/elasticsearch-filter-context-practice/
版权声明: 本文为 InfoQ 作者【极限实验室】的原创文章。
原文链接:【http://xie.infoq.cn/article/455374775f97caab7a077e584】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论