测试 TIDB in k8s 一次问题记录(pd failed to respond)
作者: WalterWj 原文来源:https://tidb.net/blog/ebea9a8e
问题背景
单机装了个 k8s,TIDB 部署启动的时候看报错好像是 tikv 访问不到 pd。
但是通过 tikv pod curl pd 端口是通的 (404 代表通,但是 API 不存在)。
而且可以看到本地目录 pd 是预期产生文件了的。登录 pd pod,执行 pd-ctl 也是正常执行。member 命令下有内容
解决方法
这个时候已经到了问题瓶颈,因为手动调试网络通的,但是 tikv 确实访问不到 🤔。后来内部请教了下研发,原来我不是第一个遇到这个问题的。
相关 ISSUE:https://github.com/pingcap/tidb-operator/issues/5372#issuecomment-1794020036
按照相关 ISSUE 配置后:
看起来 tikv 预期创建文件。kubectl logs 查看 tikv pod 也是预期解决。
搜索了下 GRPC_DNS_RESOLVER native 原理,看到 gRpc 有相关 ISSUE,感觉是 gRpc 的问题 🤔
ISSUE:https://github.com/grpc/grpc/issues/18691
这个问题解决了很久,Google 半天居然没有找到解决方案,这里分享下。(头皮发麻)
这里感谢下贵司研发 笔芯。
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/04658a665e5f22d16b9b9fe88】。文章转载请联系作者。
评论