TiDB 服务 网卡接收流量][异常:+1] 问题分析 & 定位
作者: llplmlyd 原文来源:https://tidb.net/blog/be2155b1
异常信息:TiDB 节点 [网卡接收流量][异常:+1] - [网卡接收流量:7238.37 Mbps, 超过阈值:6000Mbps]
集群版本信息 :5.7.25-TiDB-v3.0.13
集群架构 :负载均衡 haproxy+3TiDB + nTiKV +3PD
1、开启 haproxy 访问日志、开启 tidb session 节点的 general log
2、观察 node_exporter 得到异常流量时间段
3、观察另一个监控面板
找到对应异常时间段 峰值最高的 tikv 机器 获得他的 ip 端口
4、在异常 tidb 节点上 查找对应时间段的 tidb.log 和 tidb_slow_query.log
查看经常发送消息到该 tikv 的时间戳 ,是否经常性重复
[root@ log]# cat tidb-2020-11-26T14-38-01.423.log|grep ‘10.64.126.38’|less
找对对应的 sql 再次确认是否批量中查询
[root@ log]# cat tidb-2020-11-26T14-38-01.423.log|grep ‘421100675562733590’|wc -l
9162
5、查看了慢查询日志找到对应的 sql 语句
select * from audit_result where doc_id=389611123;
6、查看该 sql 的表结构:该查询字段存在索引,但是该字段格式为 varchar
explain 分析该 sql 发现 不带引号扫了全表 没有走索引
由于引号引起的坑 记录一下 #
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/578cb4f4f4593022f23a08ed6】。文章转载请联系作者。
评论