写点什么

Elasticsearch filter vs. query 对比

用户头像
escray
关注
发布于: 2021 年 02 月 20 日
Elasticsearch filter vs. query 对比

Elasticsearch filter vs. query,文字内容来自 B 站中华石杉 Elasticsearch 顶尖高手系列课程核心知识篇,英文内容来自官方文档。

filter 与 query 示例


测试数据准备:


PUT /employee/_doc/1{  "address": {    "country": "china",    "province": "jiangsu",    "city": "nanjing"  },  "name": "tom",  "age": 30,  "join_date": "2016-01-01"}
PUT /employee/_doc/2{ "address": { "country": "china", "province": "shanxxi", "city": "xian" }, "name": "marry", "age": 35, "join_date": "2015-01-01"}
复制代码


搜索请求:年龄必须大于等于 30,同时 join_date 必须是 2016-01-01


GET /employee/_search{  "query": {    "bool": {      "must": [        {          "match": {            "join_date": "2016-01-01"          }        }        ],        "filter": {          "range": {            "age": {              "gte": 30            }          }        }    }  }}
复制代码
filter 与 query 对比


  • filter,仅仅只是按照搜索条件过滤出需要的数据而已,不计算任何相关度分数,对相关度没有任何影响

  • query,会去计算每个 document 相对于搜索条件的相关度,并按照相关度进行排序。


一般来说,如果你是在进行搜索,需要将最匹配搜索条件的数据先返回,那么用 query;如果你只是要根据一些条件筛选出一部分数据,不关注其排序,那么用 filter。


除非是你的这些搜索条件,你希望越符合这些搜索条件的 document 越排在前面返回,那么这些搜索条件要放在 query 中;如果你不希望一些搜索条件来影响你的 document 排序,那么就放在 filter 中即可

filter 与 query 性能


  • filter,不需要计算相关度分数,不需要按照相关度分数进行排序,同时还有内置的自动 cache 最常使用 filter 的数据

  • query,要计算相关度分数,按照分数进行排序,而且无法 cache 结果



那么简单来说,一般情况下 filter 可能会更快一些,但是没有办法对结果进行排序,filter 和 query 有各自的使用场景。

发布于: 2021 年 02 月 20 日阅读数: 18
用户头像

escray

关注

Let's Go 2017.11.19 加入

在学 Elasticsearch 的项目经理

评论

发布
暂无评论
Elasticsearch filter vs. query 对比