写点什么

Docker 安装 Elasticsearch、ik 分词器、可视化工具

作者:宁在春
  • 2022 年 7 月 23 日
  • 本文字数:2886 字

    阅读完需:约 9 分钟

Docker安装Elasticsearch、ik分词器、可视化工具

最近在弄这个Elasticsearch,技术发展所要求,现在还有什么我不需要去学吗?麻了麻了。沉下去,再浮上来,我想我们会变的不一样的。😁

一、Docker 安装 Elasticsearch

1.1、拉取 Elasticsearch 镜像

docker pull elasticsearch:7.7.0
复制代码



查看镜像命令:docker images


删除镜像命令:docker rmi <镜像名:版本号> or docker rmi <镜像id>


1.2、启动前准备

创建存放数据及配置文件的文件夹,启动时挂载。


mkdir -p  /home/elasticsearch/data/ mkdir -p  /home/elasticsearch/config/
复制代码



解释


  • -p: 参数来创建多级文件夹

  • tree:以树形结构展示文件目录


编写配置文件


echo 'http.host: 0.0.0.0http.cors.enabled: truehttp.cors.allow-origin: "*" '>>/home/elasticsearch/config/elasticsearch.yml
复制代码



解释


  • echo >> :是利用了 Shell 编程语法,使用 echo >>指令向文件追加内容,原内容将保存

  • 使用 > 指令的话就是覆盖文件原内容并重新输入内容,若文件不存在则创建文件。

  • cat:展示文件内容。

  • http.cors.enabled: truehttp.cors.allow-origin: "*" 配置是为了解决跨域问题,因为等下还要下载可视化工具查看。


修改文件夹权限


chmod -R 777 /home/elasticsearch/ls -l # 查看文件权限
复制代码


1.3、启动 elasticseach 镜像

docker run --name elasticsearch -p 9200:9200 \ -p 9300:9300 \ -e "discovery.type=single-node" \ -e ES_JAVA_OPTS="-Xms64m -Xmx128m" \  -v /home/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \ -v /home/elasticsearch/data:/usr/share/elasticsearch/data \ -v /home/elasticsearch/plugins:/usr/share/elasticsearch/plugins \ -d elasticsearch:7.7.0
复制代码


参数解释


--name elasticsearch:将容器命名为 elasticsearch-p 9200:9200:将容器的9200端口映射到宿主机9200端口-p 9300:9300:将容器的9300端口映射到宿主机9300端口,目的是集群互相通信-e "discovery.type=single-node":单例模式-e ES_JAVA_OPTS="-Xms64m -Xmx128m":配置内存大小-v /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml:将配置文件挂载到宿主机-v /mydata/elasticsearch/data:/usr/share/elasticsearch/data:将数据文件夹挂载到宿主机-v /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins:将插件目录挂载到宿主机(需重启)-d elasticsearch:7.7.0:后台运行容器,并返回容器ID
复制代码


运行结果



查看是否启动成功



接下来我们就是拿浏览器访问啦。


在浏览器上输入:服务器IP地址:9200


1.4、可能出现的问题

  • 启动成功,但是访问失败的话,查看一下安全组中映射端口是否已经打开。如果是本地虚拟机,可能与防火墙相关(我用的云服务器,没有测试,如果有问题,还是需要大家自行去百度||谷歌一下)。

  • -e ES_JAVA_OPTS="-Xms64m -Xmx128m":配置内存大小出现了问题。(可试着调一下,docker玩不坏的,莫慌)

  • 最后就还有可能是配置文件中出现了问题。


  echo 'http.host: 0.0.0.0  http.cors.enabled: true  http.cors.allow-origin: "*" '>>/home/elasticsearch/config/elasticsearch.yml
复制代码


http.host: 0.0.0.0 在冒号后面有一个空格的,这里的配置文件是yml格式,所以一定要严格按照yml格式来书写。

二、为 Elasticsearch 安装 ik 分词器

2.1、什么是 IK 分词器?

分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词器是将每个字看成一个词,比如"我爱技术"会被分为"我","爱","技","术"。



结果


{    "tokens": [        {            "token": "我",            "start_offset": 0,            "end_offset": 1,            "type": "<IDEOGRAPHIC>",            "position": 0        },        {            "token": "爱",            "start_offset": 1,            "end_offset": 2,            "type": "<IDEOGRAPHIC>",            "position": 1        },        {            "token": "技",            "start_offset": 2,            "end_offset": 3,            "type": "<IDEOGRAPHIC>",            "position": 2        },        {            "token": "术",            "start_offset": 3,            "end_offset": 4,            "type": "<IDEOGRAPHIC>",            "position": 3        }    ]}
复制代码


这显然不符合要求,所以我们需要安装中文分词器 IK 来解决这个问题


IK 提供了两个分词算法:ik_smartik_max_word


其中ik_smart为最少切分,ik_max_word为最细粒度划分

2.2、安装 ik 分词器

进入已经启动成功的elasticsearch容器。


docker exec -it elasticsearch /bin/bash
复制代码



./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.7.0/elasticsearch-analysis-ik-7.7.0.zip
复制代码



下载过程中会出现这个问题,直接输入 y回车就可以了。



下载完成之后,退出去,重新启动elasticsearch容器。


docker restart <容器名o容器id>  # 重启容器命令
复制代码


2.3、测试 IK 分词器是否安装成功

安装完成后,我们再来进行测试遍,看看有什么样的变化。


postman post 请求分词测试:http://服务器IP地址:9200/_analyze


{  "tokenizer":"ik_smart",// 分词器不同,这个地方也会有变化 具体的可能还需要去学习。  "text":"我爱技术"}
复制代码



结果:


{    "tokens": [        {            "token": "我",            "start_offset": 0,            "end_offset": 1,            "type": "CN_CHAR",            "position": 0        },        {            "token": "爱",            "start_offset": 1,            "end_offset": 2,            "type": "CN_CHAR",            "position": 1        },        {            "token": "技术",            "start_offset": 2,            "end_offset": 4,            "type": "CN_WORD",            "position": 2        }    ]}
复制代码

三、安装 Elasticsearch 可视化工具 | mobz/elasticsearch-head:5

Elasticsearch可视化工具有多种,可以根据自己的喜好进行选择,我这里使用的是 mobz/elasticsearch-head:5而已。

3.1、拉取镜像

docker pull mobz/elasticsearch-head:5
复制代码


3.2、启动镜像

docker run -d --name elasticsearch-head -p 9100:9100 mobz/elasticsearch-head:5
复制代码


3.3、测试

我们在浏览器访问:http://服务器IP:9100/


3.4、可能出现的问题

elasticsearch配置文件elasticsearch.yml中 缺少了下列跨域配置。


http.cors.enabled: true http.cors.allow-origin: "*"
复制代码

🌈自言自语

下一篇写如何搭建elasticsearch集群,咱们一步一步来哈😁。


你好,我是博主宁在春,Java 学习路上的一颗小小的种子,也希望有一天能扎根长成苍天大树。


最近在持续更新中,如果你觉得文章对你有所帮助,也感兴趣的话,关注我吧。


让我们一起学习,一起讨论吧。


希望与君共勉😁


我们:待别时相见时,都已有所成

发布于: 4 小时前阅读数: 17
用户头像

宁在春

关注

一个喜欢文艺风的程序员 2022.07.01 加入

他日凌云,万事胜意

评论

发布
暂无评论
Docker安装Elasticsearch、ik分词器、可视化工具_Docker_宁在春_InfoQ写作社区