Kubernetes 日常故障解决
问题 1:K8S 集群服务访问失败?
原因分析:证书不能被识别,其原因为:自定义证书,过期等。
解决方法:更新证书即可。
问题 2:K8S 集群服务访问失败?
原因分析:端口映射错误,服务正常工作,但不能提供服务。
解决方法:删除 svc,重新映射端口即可。
问题 3:K8S 集群服务暴露失败?
原因分析:该容器已暴露服务了。
解决方法:删除 svc,重新映射端口即可。
问题 4:外网无法访问 K8S 集群提供的服务?
原因分析:K8S 集群的 type 为 ClusterIP,未将服务暴露至外网。
解决方法:修改 K8S 集群的 type 为 NodePort 即可,于是可通过所有 K8S 集群节点访问服务。
问题 5:pod 状态为 ErrImagePull?
原因分析:image 无法拉取;
解决方法:更换镜像即可。
问题 6:创建 init C 容器后,其状态不正常?
原因分析:查看日志发现,pod 一直出于初始化中;然后查看 pod 详细信息,定位 pod
创建失败的原因为:初始化容器未执行完毕。
解决方法:创建相关 service,将 SVC 的 name 写入 K8S 集群的 coreDNS 服务器中,于是
coreDNS 就能对 POD 的 initC 容器执行过程中的域名解析了。
问题 7:探测存活 pod 状态为 CrashLoopBackOff?
原因分析:镜像问题,导致容器重启失败。
解决方法:更换镜像即可。
问题 8:POD 创建失败?
原因分析:镜像问题导致容器无法启动。
解决方法:更换镜像。
问题 9:POD 的 ready 状态未进入?
原因分析:POD 的执行命令失败,无法获取资源。
解决方法:进入容器内部,创建 yaml 定义的资源
问题 10:pod 创建失败?
原因分析:yml 文件内容出错—-使用中文字符;
解决方法:修改 myregistrykey 内容即可。
11、kube-flannel-ds-amd64-ndsf7 插件 pod 的 status 为 Init:0/1?
排查思路:kubectl -n kube-system describe pod kube-flannel-ds-amd64-ndsf7 #查询 pod 描述信息;
原因分析:k8s-slave1 节点拉取镜像失败。
解决方法:登录 k8s-slave1,重启 docker 服务,手动拉取镜像。
k8s-master 节点,重新安装插件即可。
12、K8S 创建服务 status 为 ErrImagePull?
排查思路:
原因分析:拉取镜像名称问题。
解决方法:删除错误 pod;重新拉取镜像;
13、不能进入指定容器内部?
原因分析:yml 文件 comtainers 字段重复,导致该 pod 没有该容器。
解决方法:去掉 yml 文件中多余的 containers 字段,重新生成 pod。
14、创建 PV 失败?
原因分析:pv 的 name 字段重复。
解决方法:修改 pv 的 name 字段即可。
15、pod 无法挂载 PVC?
原因分析:pod 无法挂载 PVC。
accessModes 与可使用的 PV 不一致,导致无法挂载 PVC,由于只能挂载大于 1G 且 accessModes 为 RWO 的 PV,故只能成功创建 1 个 pod,第 2 个 pod 一致 pending,按序创建时则第 3 个 pod 一直未被创建;
解决方法:修改 yml 文件中 accessModes 或 PV 的 accessModes 即可。
16、问题:pod 使用 PV 后,无法访问其内容?
原因分析:nfs 卷中没有文件或权限不对。
解决方法:在 nfs 卷中创建文件并授予权限。
17、查看节点状态失败?
原因分析:没有 heapster 服务。
解决方法:安装 promethus 监控组件即可。
18、pod 一直处于 pending’状态?
原因分析:由于已使用同样镜像发布了 pod,导致无节点可调度。
解决方法:删除所有 pod 后部署 pod 即可。
19、helm 安装组件失败?
原因分析:文件名格式不对。
解决方法:mv chart.yaml Chart.yaml
版权声明: 本文为 InfoQ 作者【CTO技术共享】的原创文章。
原文链接:【http://xie.infoq.cn/article/142efeca6f086f7a094216eaa】。未经作者许可,禁止转载。
评论