写点什么

详解数仓的锁相关参数及视图

  • 2022 年 10 月 10 日
    中国香港
  • 本文字数:4665 字

    阅读完需:约 15 分钟

详解数仓的锁相关参数及视图

本文分享自华为云社区《GaussDB(DWS) 锁相关参数及视图详解》,作者: yd_220527686。

一、锁相关参数


GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。跟锁相关的参数有 4 个,具体含义如下:


1. deadlock_timeout


表示死锁检测时间,到达该时间后进行死锁检测,默认 1 秒。


2. lockwait_timeout


当出现表锁冲突的时候生效,当等待表锁的时间超过配置的时间,抛错返回,默认 20 分钟。


3. update_lockwait_timeout


当出现记录锁冲突的时候生效,如果等待记录锁的时间超过 update_lockwait_timeout,抛错返回,默认 2 分钟。


4. ddl_lock_timeout


当出现八级表锁冲突的时候生效,当等待获取八级锁的时间超过配置的时间,抛错返回,默认值为 0,表示不生效,需用户手动开启(在 8.1.3 版本及更高版本生效)。

二、锁相关参数之间的逻辑


在 8.1.3 版本中,新增加参数 ddl_lock_timeout,其优先级高于 lockwait_timeoutdeadlock_timeoutlockwait_timeout ddl_lock_timeout 的逻辑关系如下:


  1. ddl_lock_timeout 生效,且申请的锁是八级锁时,锁等待超时报错的时间为 ddl_lock_timeout 的值;当申请的锁不是八级锁时,锁等待超时报错的时间为 lockwait_timeout 的值;

  2. 如果参数 lockwait_timeout > deadlock_timeout 时,同时启死锁定时器和锁超时定时器。当参数 lockwait_timeout <= deadlock_timeout 时,只启动锁超时定时器,不启动死锁定时器。

三、构建死锁和锁超时场景示例


构建 3 个元素的死锁场景如下:



首先执行第一行(按照 session 号从小到大执行)然后执行第二行(按照 session 号从小到大执行),可以通过获取对应锁的 SQL 语句,获得锁。表锁还可以手动的使用 SQL 语句的方式进行强制上锁,SQL 语句的格式如下所示:


LOCK TABLE [ name ] IN [ lockmode ] MODE;
复制代码


其中 lockmode 可以是以下之一:ACCESS SHARE | ROW SHARE | ROW EXCLUSIVE | SHARE UPDATE EXCLUSIVE| SHARE | SHARE ROW EXCLUSIVE | EXCLUSIVE | ACCESS EXCLUSIVE

要注意的是 LOCK 语句只能在事务块中执行,事务结束会释放。


设置 deadlock_timeoutlockwait_timeout ddl_lock_timeout 的值,预期如下:


1. 当 ddl_lock_timeout = 0lockwait_timeout>deadlock_timeout > 0:



2. 当 ddl_lock_timeout = 0deadlock_timeout>lockwait_timeout > 0:



3. 当 ddl_lock_timeout != 0ddl_lock_timeout>deadlock_timeout > 0:



4. 当 ddl_lock_timeout != 0deadlock_timeout>ddl_lock_timeout > 0:



5. 当 ddl_lock_timeout != 0deadlock_timeout=ddl_lock_timeout > 0:


四、锁等待查询

1. 通过查询 pg_locks 视图查看单个节点的锁持有和等待状态,pg_locks 视图的结构如下图:


locktype    | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction |       pid       |           mode           | granted | fastpath ---------------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+-----------------+--------------------------+---------+---------- relation      |    15835 |    11835 |      |       |            |               |         |       |          | 13/3755            | 139776366208768 | AccessShareLock          | t       | t virtualxid    |          |          |      |       | 13/3755    |               |         |       |          | 13/3755            | 139776366208768 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 12/38      |               |         |       |          | 12/38              | 139776382990080 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 8/263      |               |         |       |          | 8/263              | 139776720103168 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 7/314      |               |         |       |          | 7/314              | 139776736884480 | ExclusiveLock            | t       | t virtualxid    |          |          |      |       | 5/717      |               |         |       |          | 5/717              | 139776778299136 | ExclusiveLock            | t       | t transactionid |          |          |      |       |            |        210480 |         |       |          | 12/38              | 139776382990080 | ExclusiveLock            | t       | f relation      |    15835 |    16980 |      |       |            |               |         |       |          | 12/38              | 139776382990080 | ShareUpdateExclusiveLock | t       | f relation      |    15835 |    16980 |      |       |            |               |         |       |          | 12/38              | 139776382990080 | ShareRowExclusiveLock    | t       | f
复制代码


其中:


locktype:表示锁类型,包括表锁、事务锁、扩展锁、自定义锁等;


relation:表示表的 oid,如果是表锁,relation 列会显示表的 oid


transactionid:表示事务号,如果是事务锁,transactionid 列会显示 session 的事务号;


mode:表示锁级别,级别 1-8 级;


pid:表示 session 的线程号;


granted:'t’表示持有锁,'f’表示等待锁;

2. 通过 pgxc_lockwait_detail 和 pgxc_wait_detail 查看锁等待状态,该方法仅适用于 8.1.3 及以上版本;


1. pgxc_lockwait_detail 系统视图,显示每个节点中锁等待链详细信息


查询语句:


select *  from pgxc_lockwait_detail;
复制代码



其中:


level:表示等待链中的层级,以 1 开始,每显示一层等待关系 level 会加 1。


lock_wait_hierarchy:表示等待链,以节点名称:进程号->几点名称:等待进程号->节点名称:等待进程号->…。


wait_for_pid:表示锁冲突线程的线程号


conflict_mode:表示锁冲突线程持有的冲突锁级别


query:表示查询语句


2. pgxc_wait_detail 系统视图,显示所有节点 SQL 等待从上之下的等待链详细信息,包括 wait_node、query 等


查询语句:


select *  from pgxc_wait_detail;level |                   lock_wait_hierarchy                   |  node_name   | db_name  | thread_name |      query_id      |       tid       | lwtid | ptid | tlevel | smpid |           wait_status            | wait_event | exec_cn |  wait_node   |                                       query                                       | application_name |         backend_start         |          xact_start           |          query_start          | waiting | state-------+---------------------------------------------------------+--------------+----------+-------------+--------------------+-----------------+-------+------+--------+-------+----------------------------------+------------+---------+--------------+-----------------------------------------------------------------------------------+------------------+-------------------------------+-------------------------------+-------------------------------+---------+--------     1 | cn_5002:140698314475264                                 | cn_5002      | postgres | OM          | 144959613006392061 | 140698314475264 | 21820 |      |      0 |     0 | wait node(total 3): dn_6005_6006 |            | t       | dn_6005_6006 |                                                                                  +| OM               | 2022-10-08 18:02:55.810858+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:02:55.819575+08 | t       | active       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             INSERT INTO scheduler.bandwidth_history_table                        +|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             SELECT timestamp, node_name, "rxpck/s", "txpck/s", "rxkB/s", "txkB/s"+|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |             FROM (select '2022-10-08 18:02:55' as timestamp), PGXC_COMM_STATUS;  +|                  |                               |                               |                               |         |       |                                                         |              |          |             |                    |                 |       |      |        |       |                                  |            |         |              |                                                                                   |                  |                               |                               |                               |         |      2 | cn_5002:140698314475264 -> dn_6005_6006:140246537033472 | dn_6005_6006 | postgres | cn_5002     | 144959613006392061 | 140246537033472 |  1587 |      |      0 |     0 | none                             |            | f       |              | SELECT * FROM pg_comm_status;                                                     | cn_5002          | 2022-10-08 12:01:38.70103+08  | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:03:10.493286+08 | f       | active
复制代码


其中:


wait_status:当前线程的等待状态


wait_event:持有此锁或者在等待此锁的事务的虚拟 id


exec_cn:是否执行 sql 语句的 cn 节点


wait_node:锁级别级别


query:查询语句


backend_start:后端进程启动时间,即客户端连接服务器的时间


xact_start:当前事务的启动时间


query_start:开始当前活跃查询的时间


waiting:是否正处于等待状态


state:后端当前总体状态


tips:为保证查询链条正确,在使用 pgxc_wait_detail 和 pgxc_lockwait_detail 时不能进行排序和分组。


点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 2
用户头像

提供全面深入的云计算技术干货 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算! 传送门:https://bbs.huaweicloud.com/

评论

发布
暂无评论
详解数仓的锁相关参数及视图_数据库_华为云开发者联盟_InfoQ写作社区