写点什么

Docker Swarm 从部署到基本操作

作者:程序员欣宸
  • 2022-10-17
    广东
  • 本文字数:4801 字

    阅读完需:约 1 分钟

Docker Swarm从部署到基本操作

欢迎访问我的 GitHub

这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos

关于 Docker Swarm

  • Docker Swarm 由两部分组成:


  1. Docker 集群:将一个或多个 Docker 节点组织起来,用户就能以集群的方式进行管理;

  2. 应用编排:有一套 API 用来部署和管理容器;


网络图

  • 下图是个典型的 Docker Swarm 集群部署图,来自 Docker 官网:

  • 接下来照着上图来搭建一个 Docker Swarm 集群。

准备工作

  • 本次实战一共用到了 5 台机器,配置信息全部相同,如下:


  1. 操作系统:CentOS Linux release 7.6.1810

  2. Docker 服务版本:1.13.1

  3. 防火墙都已经关闭;


  • 机器的信息如下表所示:



为什么要三个管理节点?

  • 从官方图可见,管理节点集群之间的内部管理协调使用了 Raft 共识算法,这样就保证了管理节点高可用(HA),一般情况下会参考以下两个原则:


  1. 部署奇数个管理节点,这样有利于减少脑裂;

  2. 不要部署太多管理节点,因为越多管理节点意味着需要花费跟多时间来达成共识;

部署集群步骤简介

  • 接下来的整个部署过程分为以下几步:


  1. 初始化第一个管理节点(m0);

  2. 加入新的管理节点(m1、m2);

  3. 加入工作节点(w0、w1);


  • 接下来正式开始吧;

初始化第一个管理节点(m0)

  • m0 节点的 IP 地址是 192.168.121.142 ,因此在 m0 节点执行以下命令:


docker swarm init \--advertise-addr 192.168.121.142:2377--listen-addr 192.168.121.142:2377
复制代码


  • 关于 advertise-addr 和 listen-addr 这两个参数,前者用来指定其他节点连接 m0 时的地址,后者指定承载 swarm 流量的 IP 和端口,它们更详细和深入的区别可以参考文章:https://boxboat.com/2016/08/17/whats-docker-swarm-advertise-addr/

  • 控制台返回信息如下,表明 Swarm 集群初始化成功:


Swarm initialized: current node (7585zt09o2sat82maef0ocf42) is now a manager.
To add a worker to this swarm, run the following command:
docker swarm join \ --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \ 192.168.121.142:2377
To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.
复制代码


  • 列出当前 Swarm 集群的所有节点,可以看到唯一的节点 m0 的状态和身份:


[root@m0 ~]# docker node lsID                           HOSTNAME  STATUS  AVAILABILITY  MANAGER STATUS7585zt09o2sat82maef0ocf42 *  m0        Ready   Active        Leader
复制代码


  • 现在集群已经建立起来了,接下来我们需要加入更多的管理节点和工作节点;

如何加入新的节点?

  • Docker Swarm 的新节点加入策略是从管理节点获取一长串命令,被称为 join token,任何想加入集群的机器只要自己执行这个 join token 即可加入 Swarm 集群;

  • 如果有新的管理节点需要加入,在 m0 执行命令 docker swarm join-token manager 即可得到管理节点的 join token,如下所示:


[root@m0 ~]# docker swarm join-token managerTo add a manager to this swarm, run the following command:
docker swarm join \ --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-5tz9d4w7nwzu8r4ozd0ff2aiu \ 192.168.121.142:2377
复制代码


  • 如果有新的工作节点需要加入,在 m0 执行命令 docker swarm join-token worker 即可得到工作节点的 join token,如下所示:


[root@m0 ~]# docker swarm join-token workerTo add a worker to this swarm, run the following command:
docker swarm join \ --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \ 192.168.121.142:2377
复制代码


  • 两种 join token 都准备好了,接下来开始加入新节点。

加入管理节点 m1、m2

  • 在 m1 上执行前面取得的管理节点 join token:


[root@m1 ~]# docker swarm join \>     --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-5tz9d4w7nwzu8r4ozd0ff2aiu \>     192.168.121.142:2377This node joined a swarm as a manager.
复制代码


  • 在 m2 上做同样的操作;

  • 在 m0、m1、m2 其中的任意一台上执行命令 docker node ls 查看 Swarm 集群的现状,如下图,可见三个管理节点都是正常状态,ID 字段带有星号后缀表示当前执行命令的机器是 m1:


[root@m1 ~]# docker node lsID                           HOSTNAME  STATUS  AVAILABILITY  MANAGER STATUS0isfyre69mdu1hm11esf1q3dk    m2        Ready   Active        Reachable7585zt09o2sat82maef0ocf42    m0        Ready   Active        Leaderslc0hjbs7jh2hdi8ai3wohy23 *  m1        Ready   Active        Reachable
复制代码

加入工作节点 w0、w1

  • 在 w0 上执行前面取得的工作节点的 join token:


[root@w0 ~]# docker swarm join \>     --token SWMTKN-1-5huefb5501cv7p8i2op1am2oevasoqu4te8vpvapndkudvszb4-e8l6755jstd7urpdo5smyi8fv \>     192.168.121.142:2377This node joined a swarm as a worker.
复制代码


  • 在 w1 上做同样的操作;

  • 在 m0、m1、m2 其中的任意一台上执行命令 docker node ls 查看 Swarm 集群的现状,可见工作节点已经全部就绪:


[root@m0 ~]# docker node lsID                           HOSTNAME  STATUS  AVAILABILITY  MANAGER STATUS0isfyre69mdu1hm11esf1q3dk    m2        Ready   Active        Reachable7585zt09o2sat82maef0ocf42 *  m0        Ready   Active        Leaderi71bcxt1auc804syybroajtan    w1        Ready   Active        slc0hjbs7jh2hdi8ai3wohy23    m1        Ready   Active        Reachablewqcwcccva3d3mxgi5p423d4fv    w0        Ready   Active
复制代码


  • 至此,Swarm 集群环境搭建完毕,接下来可以验证了。

验证 Swarm 集群环境

  • 创建名为 tomcat-net 的覆盖网络(Overlay Netowork),这是个二层网络,处于该网络下的 docker 容器,即使宿主机不一样,也能相互访问:


docker network create -d overlay tomcat-net
复制代码


  • 创建名为 tomcat 的服务,使用了刚才创建的覆盖网络:


docker service create --name tomcat \--network tomcat-net \-p 8080:8080 \--replicas 3 \tomcat:7.0.96-jdk8-openjdk
复制代码


  • 执行命令 docker service ls 查看当前所有服务:


[root@m0 ~]# docker service lsID            NAME    MODE        REPLICAS  IMAGEkguawc4b5th4  tomcat  replicated  3/3       tomcat:7.0.96-jdk8-openjdk
复制代码


  • 执行命令 docker service ps tomcat 查看名为 tomcat 的服务,可见三个容器分别部署在 m0、m2、w1 机器上:


[root@m0 ~]# docker service ps tomcatID            NAME      IMAGE                       NODE  DESIRED STATE  CURRENT STATE           ERROR  PORTSn1gs9f1plce2  tomcat.1  tomcat:7.0.96-jdk8-openjdk  w1    Running        Running 19 minutes ago         q8jyg088ci21  tomcat.2  tomcat:7.0.96-jdk8-openjdk  m2    Running        Running 19 minutes ago         h9ww33dpw56m  tomcat.3  tomcat:7.0.96-jdk8-openjdk  m0    Running        Running 19 minutes ago
复制代码


  • 执行命令 docker service inspect --pretty tomcat 查看名为 tomcat 的服务的详细信息(去掉--pretty 可以看到更完整的):


[root@m0 ~]# docker service inspect --pretty tomcat
ID: kguawc4b5th4qlwlsv183qtaiName: tomcatService Mode: Replicated Replicas: 3Placement:UpdateConfig: Parallelism: 1 On failure: pause Max failure ratio: 0ContainerSpec: Image: tomcat:7.0.96-jdk8-openjdk@sha256:91eadffb59d9a35ada2d39fcd616a749ac580aa5e834499b7128f27be2e46623Resources:Networks: tomcat-net Endpoint Mode: vipPorts: PublishedPort 8080 Protocol = tcp TargetPort = 8080
复制代码


  • 打开浏览器,尝试访问 m0、m1、m2、w0、w1 这个五个机器的 8080 端口,都可以成功访问 tomcat 首页:

服务模式

  • 服务模式一共有两种:Ingress 和 Host,如果不指定,则默认的是 Ingress;

  • Ingress 模式下,到达 Swarm 任何节点的 8080 端口的流量,都会映射到任何服务副本的内部 80 端口,就算该节点上没有 tomcat 服务副本也会映射;

  • Host 模式下,仅在运行有容器副本的机器上开放端口,使用 Host 模式的命令如下:


docker service create --name tomcat \--network tomcat-net \--publish published=8080,target=8080,mode=host \--replicas 3 \tomcat:7.0.96-jdk8-openjdk
复制代码

服务扩缩容

  • 执行命令 docker service scale tomcat=5 将副本数从 3 调整为 5:


[root@m0 ~]# docker service scale tomcat=5tomcat scaled to 5
复制代码


  • 执行命令 docker service ps tomcat 查看名为 tomcat 的服务,可见每台机器上都分布了一个容器:


[root@m0 ~]# docker service ps tomcatID            NAME      IMAGE                       NODE  DESIRED STATE  CURRENT STATE               ERROR  PORTSw32tjahze2fk  tomcat.1  tomcat:7.0.96-jdk8-openjdk  m2    Running        Running 42 minutes ago             yj5czwwhrrsh  tomcat.2  tomcat:7.0.96-jdk8-openjdk  m0    Running        Running 42 minutes ago             pq40995nbd0k  tomcat.3  tomcat:7.0.96-jdk8-openjdk  w1    Running        Running 42 minutes ago             y1y6z1jczel1  tomcat.4  tomcat:7.0.96-jdk8-openjdk  m1    Running        Running about a minute ago         w0dcii8f79os  tomcat.5  tomcat:7.0.96-jdk8-openjdk  w0    Running        Running about a minute ago
复制代码

滚动升级

  • 当前 tomcat 服务中,tomcat 镜像的 tag 是 7.0.96-jdk8-openjdk ,我们来尝试升级到 9.0.24-jdk11-openjdk ,执行以下命令:


docker service update \--image tomcat:9.0.24-jdk11-openjdk \--update-parallelism 1 \--update-delay 10s tomcat
复制代码


  • 上述命令有几处需要注意:a. update-parallelism:每次更新的容器数量,这里设置为 1,表示每一个容器升级成功后才去升级下一个;b. update-delay:每一批升级成功后,升级下一批之前的等待时间,这里表示升级一个容器后等 10 秒再升级下一个;

  • 在升级过程中执行命令 docker service ps tomcat 查看服务,可以看到新版本容器逐个启动的过程:


[root@m0 ~]# docker service ps tomcatID            NAME          IMAGE                        NODE  DESIRED STATE  CURRENT STATE                ERROR  PORTSw32tjahze2fk  tomcat.1      tomcat:7.0.96-jdk8-openjdk   m2    Running        Running 56 minutes ago              yj5czwwhrrsh  tomcat.2      tomcat:7.0.96-jdk8-openjdk   m0    Running        Running 56 minutes ago              semuna9awsn7  tomcat.3      tomcat:9.0.24-jdk11-openjdk  w1    Running        Running 15 seconds ago              pq40995nbd0k   \_ tomcat.3  tomcat:7.0.96-jdk8-openjdk   w1    Shutdown       Shutdown about a minute ago         y1y6z1jczel1  tomcat.4      tomcat:7.0.96-jdk8-openjdk   m1    Running        Running 15 minutes ago              oot3yex74v4t  tomcat.5      tomcat:9.0.24-jdk11-openjdk  w0    Running        Preparing 5 seconds ago             w0dcii8f79os   \_ tomcat.5  tomcat:7.0.96-jdk8-openjdk   w0    Shutdown       Shutdown 3 seconds ago
复制代码


  • 升级完成后,用浏览器访问服务,可见 tomcat 版本已经升级:

删除服务

  • 执行命令 docker service rm tomcat 即可删除服务:


[root@m0 ~]# docker service rm tomcattomcat[root@m0 ~]# docker service lsID  NAME  MODE  REPLICAS  IMAGE
复制代码


  • 至此,Docker Swarm 从部署到基本操都已经体验过一次了,希望您在搭建环境的时候,本文能给您一些参考。

欢迎关注 InfoQ:程序员欣宸

学习路上,你不孤单,欣宸原创一路相伴...


发布于: 刚刚阅读数: 3
用户头像

搜索"程序员欣宸",一起畅游Java宇宙 2018-04-19 加入

前腾讯、前阿里员工,从事Java后台工作,对Docker和Kubernetes充满热爱,所有文章均为作者原创,个人Github:https://github.com/zq2599/blog_demos

评论

发布
暂无评论
Docker Swarm从部署到基本操作_Docker_程序员欣宸_InfoQ写作社区