本文分享自华为云社区《GaussDB(DWS) 锁相关参数及视图详解》,作者: yd_220527686。
一、锁相关参数
GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。跟锁相关的参数有 4 个,具体含义如下:
1. deadlock_timeout
表示死锁检测时间,到达该时间后进行死锁检测,默认 1 秒。
2. lockwait_timeout
当出现表锁冲突的时候生效,当等待表锁的时间超过配置的时间,抛错返回,默认 20 分钟。
3. update_lockwait_timeout
当出现记录锁冲突的时候生效,如果等待记录锁的时间超过 update_lockwait_timeout,抛错返回,默认 2 分钟。
4. ddl_lock_timeout
当出现八级表锁冲突的时候生效,当等待获取八级锁的时间超过配置的时间,抛错返回,默认值为 0,表示不生效,需用户手动开启(在 8.1.3 版本及更高版本生效)。
二、锁相关参数之间的逻辑
在 8.1.3 版本中,新增加参数 ddl_lock_timeout,其优先级高于 lockwait_timeout。deadlock_timeout、lockwait_timeout 和 ddl_lock_timeout 的逻辑关系如下:
当 ddl_lock_timeout 生效,且申请的锁是八级锁时,锁等待超时报错的时间为 ddl_lock_timeout 的值;当申请的锁不是八级锁时,锁等待超时报错的时间为 lockwait_timeout 的值;
如果参数 lockwait_timeout > deadlock_timeout 时,同时启死锁定时器和锁超时定时器。当参数 lockwait_timeout <= deadlock_timeout 时,只启动锁超时定时器,不启动死锁定时器。
三、构建死锁和锁超时场景示例
构建 3 个元素的死锁场景如下:
首先执行第一行(按照 session 号从小到大执行)然后执行第二行(按照 session 号从小到大执行),可以通过获取对应锁的 SQL 语句,获得锁。表锁还可以手动的使用 SQL 语句的方式进行强制上锁,SQL 语句的格式如下所示:
 LOCK TABLE [ name ] IN [ lockmode ] MODE;
       复制代码
 
其中 lockmode 可以是以下之一:ACCESS SHARE | ROW SHARE | ROW EXCLUSIVE | SHARE UPDATE EXCLUSIVE| SHARE | SHARE ROW EXCLUSIVE | EXCLUSIVE | ACCESS EXCLUSIVE
要注意的是 LOCK 语句只能在事务块中执行,事务结束会释放。
设置 deadlock_timeout、lockwait_timeout 和 ddl_lock_timeout 的值,预期如下:
1. 当 ddl_lock_timeout = 0,lockwait_timeout>deadlock_timeout > 0:
2. 当 ddl_lock_timeout = 0,deadlock_timeout>lockwait_timeout > 0:
3. 当 ddl_lock_timeout != 0,ddl_lock_timeout>deadlock_timeout > 0:
4. 当 ddl_lock_timeout != 0,deadlock_timeout>ddl_lock_timeout > 0:
5. 当 ddl_lock_timeout != 0,deadlock_timeout=ddl_lock_timeout > 0:
四、锁等待查询
1. 通过查询 pg_locks 视图查看单个节点的锁持有和等待状态,pg_locks 视图的结构如下图:
 locktype    | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction |       pid       |           mode           | granted | fastpath ---------------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+-----------------+--------------------------+---------+---------- relation      |    15835 |    11835 |      |       |            |               |         |       |          | 13/3755            | 139776366208768 | AccessShareLock          | t       | t virtualxid    |          |          |      |       | 13/3755    |               |         |       |          | 13/3755            | 139776366208768 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 12/38      |               |         |       |          | 12/38              | 139776382990080 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 8/263      |               |         |       |          | 8/263              | 139776720103168 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 7/314      |               |         |       |          | 7/314              | 139776736884480 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 5/717      |               |         |       |          | 5/717              | 139776778299136 | ExclusiveLock            | t       | t transactionid |          |          |      |       |            |        210480 |         |       |          | 12/38              | 139776382990080 | ExclusiveLock            | t       | f relation      |    15835 |    16980 |      |       |            |               |         |       |          | 12/38              | 139776382990080 | ShareUpdateExclusiveLock | t       | f relation      |    15835 |    16980 |      |       |            |               |         |       |          | 12/38              | 139776382990080 | ShareRowExclusiveLock    | t       | f
       复制代码
 
其中:
locktype:表示锁类型,包括表锁、事务锁、扩展锁、自定义锁等;
relation:表示表的 oid,如果是表锁,relation 列会显示表的 oid
transactionid:表示事务号,如果是事务锁,transactionid 列会显示 session 的事务号;
mode:表示锁级别,级别 1-8 级;
pid:表示 session 的线程号;
granted:'t’表示持有锁,'f’表示等待锁;
2. 通过 pgxc_lockwait_detail 和 pgxc_wait_detail 查看锁等待状态,该方法仅适用于 8.1.3 及以上版本;
1. pgxc_lockwait_detail 系统视图,显示每个节点中锁等待链详细信息
查询语句:
 select *  from pgxc_lockwait_detail;
       复制代码
 
其中:
level:表示等待链中的层级,以 1 开始,每显示一层等待关系 level 会加 1。
lock_wait_hierarchy:表示等待链,以节点名称:进程号->几点名称:等待进程号->节点名称:等待进程号->…。
wait_for_pid:表示锁冲突线程的线程号
conflict_mode:表示锁冲突线程持有的冲突锁级别
query:表示查询语句
2. pgxc_wait_detail 系统视图,显示所有节点 SQL 等待从上之下的等待链详细信息,包括 wait_node、query 等
查询语句:
 select *  from pgxc_wait_detail;level |                   lock_wait_hierarchy                   |  node_name   | db_name  | thread_name |      query_id      |       tid       | lwtid | ptid | tlevel | smpid |           wait_status            | wait_event | exec_cn |  wait_node   |                                       query                                       | application_name |         backend_start         |          xact_start           |          query_start          | waiting | state-------+---------------------------------------------------------+--------------+----------+-------------+--------------------+-----------------+-------+------+--------+-------+----------------------------------+------------+---------+--------------+-----------------------------------------------------------------------------------+------------------+-------------------------------+-------------------------------+-------------------------------+---------+--------     1 | cn_5002:140698314475264                                 | cn_5002      | postgres | OM          | 144959613006392061 | 140698314475264 | 21820 |      |      0 |     0 | wait node(total 3): dn_6005_6006 |            | t       | dn_6005_6006 |                                                                                  +| OM               | 2022-10-08 18:02:55.810858+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:02:55.819575+08 | t       | active       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             INSERT INTO scheduler.bandwidth_history_table                        +|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             SELECT timestamp, node_name, "rxpck/s", "txpck/s", "rxkB/s", "txkB/s"+|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             FROM (select '2022-10-08 18:02:55' as timestamp), PGXC_COMM_STATUS;  +|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |                                                                                   |                  |                               |                               |                               |         |      2 | cn_5002:140698314475264 -> dn_6005_6006:140246537033472 | dn_6005_6006 | postgres | cn_5002     | 144959613006392061 | 140246537033472 |  1587 |      |      0 |     0 | none                             |            | f       |              | SELECT * FROM pg_comm_status;                                                     | cn_5002          | 2022-10-08 12:01:38.70103+08  | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:03:10.493286+08 | f       | active
       复制代码
 
其中:
wait_status:当前线程的等待状态
wait_event:持有此锁或者在等待此锁的事务的虚拟 id
exec_cn:是否执行 sql 语句的 cn 节点
wait_node:锁级别级别
query:查询语句
backend_start:后端进程启动时间,即客户端连接服务器的时间
xact_start:当前事务的启动时间
query_start:开始当前活跃查询的时间
waiting:是否正处于等待状态
state:后端当前总体状态
tips:为保证查询链条正确,在使用 pgxc_wait_detail 和 pgxc_lockwait_detail 时不能进行排序和分组。
点击关注,第一时间了解华为云新鲜技术~
评论