写点什么

ES 知识总结

发布于: 3 小时前

一、索引、文档和 REST API

文档是可搜索数据的最小单位

Index 索引是文档的容器,是一类文档的结合,Index 体现了逻辑空间的概念:每个索引都有自己的 Mapping 定义,用于定义包含文档的字段名和字段类型。索引的 Setting 定义不同的数据分布。


term 就是索引词



二、节点、集群、分片及副本

Elasticsearch 分布式架构

  1. 存储的水平扩容

  2. 提高系统的可用性,部分节点停止服务,整个集群的服务不受影响

三、倒排索引

倒排索引包含两个部分

  1. 单词词典,记录所有文档的单词,记录单词到倒排列表的关联关系。

  2. 倒排列表,记录了单词对应的文档结合,由倒排索引组成

倒排索引项:文档 ID、词频 TF(该单词在文档中出现的次数,用于相关性评分)、位置(单词在文档中分词的位置)、偏移(记录单词的开始结束位置,实现高亮显示)

四、通过 Analyzer 进行分词

五、URI 查询

用户头像

优秀工程师 2020.06.14 加入

-热爱编程 -热爱生活 -无所畏惧

评论

发布
暂无评论
ES知识总结