TiDB 主键锁（primary key lock）问题诊断

作者：TiDB 社区干货传送门

2024-08-09
北京
本文字数：1549 字
阅读完需：约 5 分钟

作者：连连看 db 原文来源：https://tidb.net/blog/c1abbb6c

一、背景

tidb 版本 5.3，一天 prometheus 的 tikv 突然告警，报警内容包含关键字 meet lock，10 分钟大于 10000 次 meet lock。

二、排查过程

部门有要求，一旦报警，需要确定报警具体原因，所以开始以下排查

1、首先排查 TiDB 集群访问延迟是否在正常范围

平均访问延迟在 100ms 以下，没有对业务造成影响，但需要关注，排除隐患。

2、查看 tikv 日志

根据官方文档描述：

primary_lock：锁对应事务的 primary lock。
lock_version：锁对应事务的 start_ts。
key：表示被锁的 key。
lock_ttl: 锁的 TTL。
txn_size：锁所在事务在其 Region 的 key 数量，指导清锁方式。

找到 primary_lock 频率比较高的 key

cat tikv.log |grep error-response | awk -F “primary_lock:” ‘{print $2}’ | awk -F “ ” ‘{print$ 1}’ | sort | uniq -c | sort -n24 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E5362CD7765024 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E53639926B4824 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E5363B41404024 7480000000000001CA5F6980000000000000010380000000076F740903800000000014AFE0038005E53639926B4824 7480000000000001CA5F69800000000000000103800000000AC2A32B038000000000134436038005E52CA7AF566825 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E53639F48C6025 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E5363A5048C025 7480000000000001CA5F6980000000000000010380000000076F740903800000000014AFE0038005E5363B41404025 7480000000000001CE5F698000000000000001038000000005F3DFF103800000000014B9D1038005E5366AF4C89826 7480000000000001CA5F6980000000000000010380000000076F740903800000000014AFE0038005E5363B93501028 7480000000000001CA5F6980000000000000010380000000031E2BCA038000000000142F42038005E5363B93501028 7480000000000001CA5F6980000000000000010380000000076F740903800000000014AFE0038005E5363A5048C035 7480000000000001CA5F698000000000000001038000000005F3DFF103800000000014B9D1038005E5363C55A9F8

3、prometheus 监控