ES 知识总结
一、索引、文档和 REST API
文档是可搜索数据的最小单位
Index 索引是文档的容器,是一类文档的结合,Index 体现了逻辑空间的概念:每个索引都有自己的 Mapping 定义,用于定义包含文档的字段名和字段类型。索引的 Setting 定义不同的数据分布。
term 就是索引词
二、节点、集群、分片及副本
Elasticsearch 分布式架构
存储的水平扩容
提高系统的可用性,部分节点停止服务,整个集群的服务不受影响
三、倒排索引
倒排索引包含两个部分
单词词典,记录所有文档的单词,记录单词到倒排列表的关联关系。
倒排列表,记录了单词对应的文档结合,由倒排索引组成
倒排索引项:文档 ID、词频 TF(该单词在文档中出现的次数,用于相关性评分)、位置(单词在文档中分词的位置)、偏移(记录单词的开始结束位置,实现高亮显示)
四、通过 Analyzer 进行分词
五、URI 查询
评论