搭建高可用 k8s

作者：不在线第一只蜗牛

2024-06-06
福建
本文字数：6257 字
阅读完需：约 21 分钟

高可用只针对于 api-server，需要用到 nginx + keepalived，nginx 提供 4 层负载，keepalived 提供 vip(虚拟 IP)

系统采用 openEuler 22.03 LTS

1. 前期准备

因为机器内存只有 16G，所有我采用 3master + 1node

1.1 修改主机配置（所有节点操作）

修改主机名
关闭防火墙，selinux
关闭 swap
配置时间同步

主机过多，我只写 master01 的操作

# 修改主机名[root@localhost ~]# hostnamectl set-hostname master01[root@localhost ~]# bash# 关闭防火墙，selinux[root@master01 ~]# systemctl disable --now firewalld[root@master01 ~]# setenforce 0[root@master01 ~]# sed -i s"/^SELINUX=.*/SELINUX=disabled/g" /etc/selinux/config# 关闭swap[root@master01 ~]# swapoff -a# 配置时间同步[root@master01 ~]# yum install chrony -y[root@master01 ~]# chronyc sources

复制代码

1.2 开启 ipvs（所有节点）

[root@master01 ~]# cat > /etc/sysconfig/modules/ipvs.modules << END> #!/bin/bash> ipvs_modules="ip_vs ip_vs_lc ip_vs_wlc ip_vs_rr ip_vs_wrr ip_vs_lblc ip_vs_lblcr ip_vs_dh ip_vs_sh ip_vs_nq ip_vs_sed ip_vs_ftp nf_conntrack"> for kernel_module in ${ipvs_modules};do>   /sbin/modinfo -F filename ${kernel_module} > /dev/null 2>&1>   if [ 0 -eq 0]; then>   /sbin/modprobe ${kernel_module}>   fi> done> END[root@master01 ~]# chmod 755 /etc/sysconfig/modules/ipvs.modules [root@master01 ~]# bash /etc/sysconfig/modules/ipvs.modules

复制代码

1.3 配置 k8s yum 源（所有节点）

# 直接到华为镜像站搜索kubernetes[root@master01 ~]#  cat <<EOF > /etc/yum.repos.d/kubernetes.repo[kubernetes]name=Kubernetesbaseurl=https://mirrors.huaweicloud.com/kubernetes/yum/repos/kubernetes-el7-$basearchenabled=1gpgcheck=1repo_gpgcheck=0gpgkey=https://mirrors.huaweicloud.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.huaweicloud.com/kubernetes/yum/doc/rpm-package-key.gpgEOF

复制代码

使用欧拉的话需要将 $basearch 改为自己的架构 x86_64

2. 安装 docker（所有节点）

由于欧拉目前最高支持 k8s 的版本是 1.23 ，所以需要安装 docker

2.1 安装

[root@master01 ~]# yum install docker -y

复制代码

2.2 修改 docker 配置

[root@master01 ~]# vim /etc/docker/daemon.json{        "exec-opts":["native.cgroupdriver=systemd"]}

复制代码

2.3 重启 docker

[root@master01 ~]# systemctl daemon-reload[root@master01 ~]# systemctl restart docker

复制代码

3. 配置高可用(所有 master 节点)

3.1 安装软件包

[root@master01 ~]#  yum install nginx nginx-all-modules keepalived -y

复制代码

3.2 配置 nginx 负载

在 nginx 的配置文件内加入一下内容

[root@master01 ~]# vim /etc/nginx/nginx.confuser nginx;worker_processes auto;error_log /var/log/nginx/error.log;pid /run/nginx.pid; # Load dynamic modules. See /usr/share/doc/nginx/README.dynamic.include /usr/share/nginx/modules/*.conf; events {    worker_connections 1024;}# 添加这一段，要写在http段之外，因为我们用的是四层负载，并不是七层负载stream {   upstream k8s-apiserver {     server 192.168.200.163:6443;     server 192.168.200.164:6443;     server 192.168.200.165:6443;   }   server {     listen 16443;     proxy_pass k8s-apiserver;   }}# 到这里结束 # 检测语法[root@master01 ~]# nginx -tnginx: the configuration file /etc/nginx/nginx.conf syntax is oknginx: configuration file /etc/nginx/nginx.conf test is successful # 重启[root@master01 ~]# systemctl restart nginx

复制代码

3.3 配置 keepalived

# 备份原有配置[root@master01 ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak# 修改配置[root@master01 ~]# vim /etc/keepalived/keepalived.conf global_defs {    router_id master1} vrrp_instance Nginx {    state MASTER           # 只有master01写MASTER，其他master写BACKUP    interface ens33        # 写上网卡    virtual_router_id 51    priority 200           # 其他节点的值要低于这个,另外2个节点的值也不要一样    advert_int 1    authentication {        auth_type PASS        auth_pass 123    }    virtual_ipaddress {        192.168.200.200     # 写VIP    }}# 重启[root@master01 ~]# systemctl restart keepalived.service

复制代码

将原本的配置项都删除，写入这些内容

注意：只有 master01 的 state 是 MASTER，其他 2 个节点应该写为 BACKUP。且 priority 要低于 master01

3.4 验证 keepalived

# 查看master01的ens33[root@master01 ~]# ip a show ens332: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP group default qlen 1000    link/ether 00:0c:29:8d:ce:8a brd ff:ff:ff:ff:ff:ff    altname enp2s1    inet 192.168.200.163/24 brd 192.168.200.255 scope global noprefixroute ens33       valid_lft forever preferred_lft forever    inet 192.168.200.200/32 scope global ens33       valid_lft forever preferred_lft forever    inet6 fe80::ce91:fe4e:625d:6e32/64 scope link noprefixroute        valid_lft forever preferred_lft forever

复制代码

现在他有自己的 iP 和 VIP

# 停掉keepalived[root@master01 ~]# systemctl stop keepalived.service [root@master01 ~]# ip a show ens332: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP group default qlen 1000    link/ether 00:0c:29:8d:ce:8a brd ff:ff:ff:ff:ff:ff    altname enp2s1    inet 192.168.200.163/24 brd 192.168.200.255 scope global noprefixroute ens33       valid_lft forever preferred_lft forever    inet6 fe80::ce91:fe4e:625d:6e32/64 scope link noprefixroute        valid_lft forever preferred_lft forever

复制代码

停掉之后 vip 不存在了，切换到 master02 来看看

[root@master02 ~]# ip a show ens332: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP group default qlen 1000    link/ether 00:0c:29:2d:b0:8a brd ff:ff:ff:ff:ff:ff    altname enp2s1    inet 192.168.200.164/24 brd 192.168.200.255 scope global noprefixroute ens33       valid_lft forever preferred_lft forever    inet 192.168.200.200/32 scope global ens33       valid_lft forever preferred_lft forever    inet6 fe80::f409:2f97:f02e:a8d4/64 scope link noprefixroute        valid_lft forever preferred_lft forever

复制代码

现在 vip 跑到 master02 了，将 master01 的 keepalived 启动，vip 会回来，因为 master01 的

优先级高于他

[root@master01 ~]# systemctl restart keepalived.service [root@master01 ~]# systemctl enable --now nginx keepalived.service Created symlink /etc/systemd/system/multi-user.target.wants/nginx.service → /usr/lib/systemd/system/nginx.service.Created symlink /etc/systemd/system/multi-user.target.wants/keepalived.service → /usr/lib/systemd/system/keepalived.service.

复制代码

4. 部署 k8s

欧拉目前只支持 1.23 版本，所以目前的容器运行时是 docker，没有写执行节点那么就是 master01

4.1 安装软件包(所有 master 节点)

[root@master01 ~]# yum install kubeadm kubelet kubectl -y[root@master01 ~]# systemctl enable kubelet

复制代码

4.3 生成部署文件

[root@master01 ~]# kubeadm config print init-defaults > init.yaml

复制代码

4.3.1 修改部署文件

[root@master01 ~]# vim init.yamlapiVersion: kubeadm.k8s.io/v1beta3bootstrapTokens:- groups:  - system:bootstrappers:kubeadm:default-node-token  token: abcdef.0123456789abcdef  ttl: 24h0m0s  usages:  - signing  - authenticationkind: InitConfigurationlocalAPIEndpoint:  advertiseAddress: 192.168.200.163       # 这个地方需要修改为自己的IP地址    bindPort: 6443nodeRegistration:  criSocket: /var/run/dockershim.sock  imagePullPolicy: IfNotPresent  name: master01 # 这个地方改成你的主机名或者IP，作用是集群部署出来之后在集群内显示的名称，这里写什么到时候就是什么  taints: null---apiServer:  timeoutForControlPlane: 4m0s  certSANs:  # 添加这一整段，目的是让这些地址所在的主机都能够使用证书  - master01  - master02  - master03  - 127.0.0.1  - localhost  - kubernetes  - kubernetes.default  - kubernetes.default.svc  - kubernetes.default.svc.cluster.local  - 192.168.200.163  # 这里3个是master的IP地址  - 192.168.200.164  - 192.168.200.165  - 192.168.200.200  # VIP也需要写上controlPlaneEndpoint: 192.168.200.200:16443  # 添加这一行，IP为VIPapiVersion: kubeadm.k8s.io/v1beta3certificatesDir: /etc/kubernetes/pkiclusterName: kubernetescontrollerManager: {}dns: {}etcd:  local:    dataDir: /var/lib/etcdimageRepository: swr.cn-east-3.myhuaweicloud.com/hcie_openeuler   # 镜像仓库要改为国内的kind: ClusterConfigurationkubernetesVersion: 1.23.1   # 改为kubeadm版本一样的networking:  dnsDomain: cluster.local  podSunbet: 10.244.0.0/12  # 添加这一行  serviceSubnet: 10.96.0.0/12scheduler: {}---   # 添加这一整段apiVersion: kubeproxy.config.k8s.io/v1alpha1kind: KubeProxyConfigurationmode: ipvs

复制代码

4.4 提前拉取镜像

# 这是在部署之前提前先把镜像拉取下来[root@master01 ~]# kubeadm config images pull --config ./init.yaml

复制代码

4.5 开始部署

[root@master01 ~]# kubeadm init --upload-certs --config ./init.yaml # 如果安装失败了可以执行kubeadm reset -f 重置环境再来init，如果直接init会报错

复制代码

执行成功之后会输出一些信息

  mkdir -p $HOME/.kube  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config  sudo chown $(id -u):$(id -g) $HOME/.kube/config You can now join any number of the control-plane node running the following command on each as root:# 加入新的master节点使用这个命令  kubeadm join 192.168.200.200:16443 --token abcdef.0123456789abcdef \	--discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3 \	--control-plane --certificate-key 8be5d0b8d4914a930d58c4171e748210cbdd118befa0635ffcc1031b7840386e Please note that the certificate-key gives access to cluster sensitive data, keep it secret!As a safeguard, uploaded-certs will be deleted in two hours; If necessary, you can use"kubeadm init phase upload-certs --upload-certs" to reload certs afterward. Then you can join any number of worker nodes by running the following on each as root:# 加入node节点就使用这个命令kubeadm join 192.168.200.200:16443 --token abcdef.0123456789abcdef \	--discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3

复制代码

4.6 其他 master 节点加入集群

生成的 token 只有 24 小时有效，如果 token 过期了还需要有节点加入集群的话可以执行
[root@master01 ~]# kubeadm token create --print-join-commandkubeadm join 192.168.200.200:16443 --token gb00dz.tevdizf7mxqx1egj --discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3 这个命令可以直接让 node 节点加入
如果需要加入 master 节点，那么需要加上 --control-plane --certificate-key 8be5d0b8d4914a930d58c4171e748210cbdd118befa0635ffcc1031b7840386e

[root@master02 ~]# kubeadm join 192.168.200.200:16443 --token abcdef.0123456789abcdef \	--discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3 \	--control-plane --certificate-key 8be5d0b8d4914a930d58c4171e748210cbdd118befa0635ffcc1031b7840386e[root@master02 ~]# mkdir -p $HOME/.kube[root@master02 ~]# sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config[root@master02 ~]# sudo chown $(id -u):$(id -g) $HOME/.kube/config	 [root@master03 ~]# kubeadm join 192.168.200.200:16443 --token abcdef.0123456789abcdef \	--discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3 \	--control-plane --certificate-key 8be5d0b8d4914a930d58c4171e748210cbdd118befa0635ffcc1031b7840386e[root@master03 ~]# mkdir -p $HOME/.kube[root@master03 ~]# sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config[root@master03 ~]# sudo chown $(id -u):$(id -g) $HOME/.kube/config

复制代码

可以使用 --node-name 指定加入集群后的名字

4.7 node 节点加入集群

[root@node ~]# kubeadm join 192.168.200.200:16443 --token abcdef.0123456789abcdef \        --discovery-token-ca-cert-hash sha256:de0e41b3bc59d2879af43da29f3f25cc1b133efda1f202d4c4ce5f865cad71d3

复制代码

4.8 查看集群节点

[root@master01 ~]# kubectl get nodesNAME       STATUS     ROLES                  AGE   VERSIONmaster01   NotReady   control-plane,master   45m   v1.23.1master02   NotReady   control-plane,master   27m   v1.23.1master03   NotReady   control-plane,master   27m   v1.23.1node       NotReady   <none>                 10s   v1.23.1

复制代码

5. 安装网络插件 calico

没安装网络插件之前状态是 NotReady，装完之后就是 Ready

calico官方安装文档

在官方文档里面可以找到最新的版本

[root@master01 ~]# wget https://docs.projectcalico.org/archive/v3.23/manifests/calico.yaml[root@master01 ~]# kubectl apply -f calico.yaml

复制代码

稍等一会之后，查看集群节点状态

[root@master01 ~]# kubectl get nodesNAME       STATUS   ROLES                  AGE     VERSIONmaster01   Ready    control-plane,master   5h38m   v1.23.1master02   Ready    control-plane,master   5h21m   v1.23.1master03   Ready    control-plane,master   5h21m   v1.23.1node       Ready    <none>                 4h53m   v1.23.1

复制代码

如果登了很久还没有 ready 的话可以使用

[root@master01 ~]# kubectl get pods -A

复制代码

看看那些 pod 没有起来，找到原因并解决之后就可以了

6. 验证集群是否可用

[root@master01 ~]# kubectl run web01 --image nginx:1.24pod/web01 created[root@master01 ~]# kubectl get podsNAME    READY   STATUS    RESTARTS   AGEweb01   1/1     Running   0          27s

复制代码

能够正常启动 pod

文章转载自：FuShudi
原文链接：https://www.cnblogs.com/fsdstudy/p/18233538
体验地址：http://www.jnpfsoft.com/?from=infoq

发布于: 刚刚阅读数: 4

不在线第一只蜗牛

关注

还未添加个人签名 2023-06-19 加入

还未添加个人简介

发布

暂无评论

创作场景

搭建高可用 k8s

1. 前期准备

1.1 修改主机配置（所有节点操作）

1.2 开启 ipvs（所有节点）

1.3 配置 k8s yum 源（所有节点）

2. 安装 docker（所有节点）

2.1 安装

2.2 修改 docker 配置

2.3 重启 docker

3. 配置高可用(所有 master 节点)

3.1 安装软件包

3.2 配置 nginx 负载

3.3 配置 keepalived

3.4 验证 keepalived

4. 部署 k8s

4.1 安装软件包(所有 master 节点)

4.3 生成部署文件

4.3.1 修改部署文件

4.4 提前拉取镜像

4.5 开始部署

4.6 其他 master 节点加入集群

4.7 node 节点加入集群

4.8 查看集群节点

5. 安装网络插件 calico

6. 验证集群是否可用

不在线第一只蜗牛

评论