摘要:GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。
本文分享自华为云社区《GaussDB(DWS) 锁相关参数及视图详解》,作者: yd_220527686。
一、锁相关参数
GaussDB(DWS) 中锁等待可以设置等待超时相关参数,一旦等锁的时间超过参数配置值会抛错。跟锁相关的参数有4个,具体含义如下:
1.deadlock_timeout
表示死锁检测时间,到达该时间后进行死锁检测,默认1秒。
2.lockwait_timeout
当出现表锁冲突的时候生效,当等待表锁的时间超过配置的时间,抛错返回,默认20分钟。
3.update_lockwait_timeout
当出现记录锁冲突的时候生效,如果等待记录锁的时间超过update_lockwait_timeout,抛错返回,默认2分钟。
4.ddl_lock_timeout
当出现八级表锁冲突的时候生效,当等待获取八级锁的时间超过配置的时间,抛错返回,默认值为0,表示不生效,需用户手动开启(在8.1.3版本及更高版本生效)。
二、锁相关参数之间的逻辑
在8.1.3版本中,新增加参数ddl_lock_timeout,其优先级高于lockwait_timeout。deadlock_timeout、lockwait_timeout和ddl_lock_timeout的逻辑关系如下:
- 当ddl_lock_timeout生效,且申请的锁是八级锁时,锁等待超时报错的时间为ddl_lock_timeout的值;当申请的锁不是八级锁时,锁等待超时报错的时间为lockwait_timeout的值;
- 如果参数lockwait_timeout > deadlock_timeout时,同时启死锁定时器和锁超时定时器。当参数lockwait_timeout <= deadlock_timeout时,只启动锁超时定时器,不启动死锁定时器。
三、构建死锁和锁超时场景示例
构建3个元素的死锁场景如下:
首先执行第一行(按照session号从小到大执行)然后执行第二行(按照session号从小到大执行),可以通过获取对应锁的SQL语句,获得锁。表锁还可以手动的使用SQL语句的方式进行强制上锁,SQL语句的格式如下所示:
LOCK TABLE [ name ] IN [ lockmode ] MODE;
其中 lockmode 可以是以下之一:
ACCESS SHARE | ROW SHARE | ROW EXCLUSIVE | SHARE UPDATE EXCLUSIVE
| SHARE | SHARE ROW EXCLUSIVE | EXCLUSIVE | ACCESS EXCLUSIVE
要注意的是LOCK语句只能在事务块中执行,事务结束会释放。
设置deadlock_timeout、lockwait_timeout和ddl_lock_timeout的值,预期如下:
1.当ddl_lock_timeout = 0,lockwait_timeout>deadlock_timeout > 0:
2.当ddl_lock_timeout = 0,deadlock_timeout>lockwait_timeout > 0:
3.当ddl_lock_timeout != 0,ddl_lock_timeout>deadlock_timeout > 0:
4.当ddl_lock_timeout != 0,deadlock_timeout>ddl_lock_timeout > 0:
5.当ddl_lock_timeout != 0,deadlock_timeout=ddl_lock_timeout > 0:
四、锁等待查询
1. 通过查询pg_locks视图查看单个节点的锁持有和等待状态,pg_locks视图的结构如下图:
locktype | database | relation | page | tuple | virtualxid | transactionid | classid | objid | objsubid | virtualtransaction | pid | mode | granted | fastpath
---------------+----------+----------+------+-------+------------+---------------+---------+-------+----------+--------------------+-----------------+--------------------------+---------+----------
relation | 15835 | 11835 | | | | | | | | 13/3755 | 139776366208768 | AccessShareLock | t | t
virtualxid | | | | | 13/3755 | | | | | 13/3755 | 139776366208768 | ExclusiveLock | t | t
virtualxid | | | | | 12/38 | | | | | 12/38 | 139776382990080 | ExclusiveLock | t | t
virtualxid | | | | | 8/263 | | | | | 8/263 | 139776720103168 | ExclusiveLock | t | t
virtualxid | | | | | 7/314 | | | | | 7/314 | 139776736884480 | ExclusiveLock | t | t
virtualxid | | | | | 5/717 | | | | | 5/717 | 139776778299136 | ExclusiveLock | t | t
transactionid | | | | | | 210480 | | | | 12/38 | 139776382990080 | ExclusiveLock | t | f
relation | 15835 | 16980 | | | | | | | | 12/38 | 139776382990080 | ShareUpdateExclusiveLock | t | f
relation | 15835 | 16980 | | | | | | | | 12/38 | 139776382990080 | ShareRowExclusiveLock | t | f
其中:
locktype:表示锁类型,包括表锁、事务锁、扩展锁、自定义锁等;
relation:表示表的oid,如果是表锁,relation列会显示表的oid
transactionid:表示事务号,如果是事务锁,transactionid列会显示session的事务号
mode:表示锁级别,级别1-8级;
pid:表示session的线程号;
granted:'t’表示持有锁,'f’表示等待锁;
2. 通过pgxc_lockwait_detail和pgxc_wait_detail查看锁等待状态,该方法仅适用于8.1.3及以上版本;
1、pgxc_lockwait_detail系统视图,显示每个节点中锁等待链详细信息
查询语句:
select * from pgxc_lockwait_detail;
其中:
level:表示等待链中的层级,以1开始,每显示一层等待关系level会加1。
lock_wait_hierarchy:表示等待链,以节点名称:进程号->几点名称:等待进程号->节点名称:等待进程号->…。
wait_for_pid:表示锁冲突线程的线程号
conflict_mode:表示锁冲突线程持有的冲突锁级别
query:表示查询语句
2、pgxc_wait_detail系统视图,显示所有节点SQL等待从上之下的等待链详细信息,包括wait_node、query等
查询语句:
select * from pgxc_wait_detail;
level | lock_wait_hierarchy | node_name | db_name | thread_name | query_id | tid | lwtid | ptid | tlevel | smpid | wait_status | wait_event | exec_cn | wait_node | query | application_name | backend_start | xact_start | query_start | waiting | state
-------+---------------------------------------------------------+--------------+----------+-------------+--------------------+-----------------+-------+------+--------+-------+----------------------------------+------------+---------+--------------+-----------------------------------------------------------------------------------+------------------+-------------------------------+-------------------------------+-------------------------------+---------+--------
1 | cn_5002:140698314475264 | cn_5002 | postgres | OM | 144959613006392061 | 140698314475264 | 21820 | | 0 | 0 | wait node(total 3): dn_6005_6006 | | t | dn_6005_6006 | +| OM | 2022-10-08 18:02:55.810858+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:02:55.819575+08 | t | active
| | | | | | | | | | | | | | | INSERT INTO scheduler.bandwidth_history_table +| | | | | |
| | | | | | | | | | | | | | | SELECT timestamp, node_name, "rxpck/s", "txpck/s", "rxkB/s", "txkB/s"+| | | | | |
| | | | | | | | | | | | | | | FROM (select '2022-10-08 18:02:55' as timestamp), PGXC_COMM_STATUS; +| | | | | |
| | | | | | | | | | | | | | | | | | | | |
2 | cn_5002:140698314475264 -> dn_6005_6006:140246537033472 | dn_6005_6006 | postgres | cn_5002 | 144959613006392061 | 140246537033472 | 1587 | | 0 | 0 | none | | f | | SELECT * FROM pg_comm_status; | cn_5002 | 2022-10-08 12:01:38.70103+08 | 2022-10-08 18:03:10.478458+08 | 2022-10-08 18:03:10.493286+08 | f | active
其中:
wait_status:当前线程的等待状态
wait_event:持有此锁或者在等待此锁的事务的虚拟id
exec_cn:是否执行sql语句的cn节点
wait_node:锁级别级别
query:查询语句
backend_start:后端进程启动时间,即客户端连接服务器的时间
xact_start:当前事务的启动时间
query_start:开始当前活跃查询的时间
waiting:是否正处于等待状态
state:后端当前总体状态
tips:为保证查询链条正确,在使用pgxc_wait_detail和pgxc_lockwait_detail时不能进行排序和分组。