写点什么

一篇就懂,230 页 Elasticsearch 大数据搜索引擎解读 PDF

作者:不想秃头
  • 2022 年 1 月 22 日
  • 本文字数:1259 字

    阅读完需:约 4 分钟

智慧生物的大规模协作造就了惊人的进化奇迹。大规模机器集群造就机器系统进化成为强大的智能系统。Elasticsearch 作为大数据与搜索引擎技术的结合体,随着社会对大规模开源分布式搜索引擎的需求迅速成长。


本篇文章从基本概念开始熟悉 Elasticsearch,接下来介绍了 Elasticsearch 在 Windows 和 Linux 操作系统下的安装。除了 CURL 命令,介绍了使用常用的编程工具和 Elasticsearch 搜索服务交互,包括 Java、Python、Scala 和 PHP,以及使用 SQL 语句查诲 Elasticsearch 索引的方法。自然语言文本理解往往以插件形式存在于 Elasticsearch 集群中。


第 2 章介绍了如何开发与测试插件。因为 Elasticsearch 经常用于实时搜索或分析,所以性能优化很重要。第 3 章介绍了如何管理 Elasticsearch 集群。为了更合理地使用和扩展 Elasticsearch,第 4 章简单分析了 github 中托管的 Elasticsearch 源代码。对于搜索引擎来说,返回结果的相关性是一个重要的话题,第 5 章讨论了这个问题。第 6 章介绍了使用 Java 开发搜索引擎 Web 用户界面的几种方法。


随着人工智能领域技术的发展,让搜索引擎智能加速变成现实。智能搜索引擎需要能够检测到并识别出图像中的文字,第 7 章介绍了结合 OpenCV 使用 Tesseract 识别文字的方法第 8 章介绍了根据问题返回搜索结果的问答式搜索。目前 Elasticsearch 是实时系统监控的首选,第 9 章介绍了使用 Elasticsearch 监控与分析日志,也介绍了通过物联网监控系统的方案


因为文章篇幅问题,以下就展示了部分截图,需要全文 PDF 文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整 pdf

第 1 章 使用 Elasticsearch


  • 1.1 基本概念

  • 1.2 安装

  • 1.3 搜索集群

  • 1.4 创建索引

  • 1.5 使用 Java 客户端接口



  • 1.6 RESTClient



  • 1.7 使用 Jest

  • 1.8 Python 客户端

  • 1.9 Scala 客户端

  • 1.10 PHP 客户端

  • 1.11 SQL 支持

  • 1.12 本章小结

第 2 章 开发插件

  • 2.1 搜索中文

  • 2.2 搜索英文

  • 2.3 使用测试套件

  • 2.4 本章小结



第 3 章 管理搜索集群

  • 3.1 节点类型

  • 3.2 管理集群

  • 3.3 写入权限控制

  • 3.4 使用 X-Pack

  • 3.5 快照

  • 3.6 Zen 发现机制

  • 3.7 联合搜索

  • 3.8 缓存

  • 3.9 本章小结



第 4 章 源码分析

  • 4.1 Lucene 源码分析

  • 4.2 Gradle

  • 4.3 Guice

  • 4.4 Joda-Time

  • 4.5 Transport

  • 4.6 线程池

  • 4.7 模块

  • 4.8 Netty

  • 4.9 分布式

  • 4.10 本章小结




因为文章篇幅问题,以下就展示了部分截图,需要全文 PDF 文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整 pdf

第 5 章 搜索相关性

  • 5.1 BM25 检索模型

  • 5.2 学习评分



第 6 章 搜索引擎用户界面

  • 6.1 JSP 实现搜索界面

  • 6.2 使用 Spring 实现的搜索界面

  • 6.3 实现搜索接口

  • 6.4 实现相似文档搜索

  • 6.5 实现 AJAX 搜索联想词

  • 6.6 推荐搜索词

  • 6.7 查询意图理解

  • 6.8 集成其他功能

  • 6.9 查询分析

  • 6.10 部署网站



第 7 章 OCR 文字识别

  • 7.1 Tesseract

  • 7.2 使用 TensorFlow 识别文字

  • 7.3 OpenCV

  • 7.4 JavaCV

  • 7.5 本章小结



第 8 章 问答式搜索

  • 8.1 生成表示语义的代码

  • 8.2 信息整合

  • 8.3 自动问答

  • 8.4 本章小结



第 9 章 Elastic 系统监控

  • 9.1 Logstash

  • 9.2 Filebeat

  • 9.3 消息过期

  • 9.4 Kibana

  • 9.5 Flume

  • 9.6 Kafka

  • 9.7 Graylog

  • 9.8 物联网数据

  • 9.9 本章小结




因为文章篇幅问题,以下就展示了部分截图,需要全文 PDF 文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整 pdf

用户头像

不想秃头

关注

还未添加个人签名 2021.09.06 加入

还未添加个人简介

评论

发布
暂无评论
一篇就懂,230页Elasticsearch大数据搜索引擎解读PDF