天天看点

PostgreSQL中如何对应SQL Server中的rowversion 5.4. 系统字段

SQL Server中有个rowversion,利用它可以实现乐观锁策略的并发更新。那么在PostgreSQL中有没有类似的东西呢?

PostgreSQL中,最接近rowversion的就是系统隐藏列xmin。而且在hibernate的PostgreSQL方言中,也是使用xmin作为行版本的标识使用。

xmin是插入该行版本的事务标识(事务ID)。PostgreSQL每次更新行都会创建一个新的行版本,所以如果其他事务修改了之前看到的记录,那么这条记录的xmin必然会变更。

点击(此处)折叠或打开

postgres=# create table tb1(id int,name text);

CREATE TABLE

postgres=# insert into tb1 values(1,'a');

INSERT 0 1

postgres=# update tb1 set name='b' where id=1;

UPDATE 1

postgres=# select xmin,* from tb1;

 xmin | id | name

-------+----+------

 55815 | 1 | b

(1 row)

但是使用xmin作为行版本标识不能区别同一个事务内的两次修改。

postgres=# begin;

BEGIN

postgres=# update tb1 set name='c' where id=1;

 55819 | 1 | c

postgres=# end;

COMMIT

不过,其实我们不需要为这个小小的瑕疵担心。

因为,事务内的第一次修改对其他事务不可见,唯一能看见它的只有修改这一行的事务自己。如果认为事务自己的第二次修改和自己的第一次修改冲突是不是有点荒谬。所以我们可以认为事务的第二次修改覆盖第一次修改是应用自己愿意。

好了,还真有钻牛角尖的。以上的差异毕竟导致了和SQL Server的rowversion的行为上的微不足道的差异,但为了避免在解释这种差异上多费口舌,我们试图找一种和SQL Server完全一致的方案。

首先我们想到了xmin+cmin。cmin代表了插入事务内部的命令标识。xmin+cmin的组合不就完美了吗。

先不考虑,组合两个字段作为行版本标识在使用上的不便,这个方法还有很大的漏洞。

因为在PostgreSQL内部,cmin和cmax使用的是共用的同一个存储域,就好像C语言中的联合。所以更新和删除操作也会修改cmin。

下面这个例子中一个回滚的更新修改了cmin,如果把cmin作为行版本号一部分使用,就会误判断为发生更新冲突了。

postgres=# select xmin,cmin,cmax,* from tb1;

 xmin | cmin | cmax | id | name

-------+------+------+----+------

 55822 | 0 | 0 | 1 | c

postgres=# insert into tb1 values(2,'a');

postgres=# update tb1 set name='d' where id=1;

postgres=# rollback;

ROLLBACK

 55822 | 1 | 1 | 1 | c

除此以外,还有一个候选是ctid。但是每次VACUUM FULL之后, 一个行的ctid都会被更新或者移动。所以如果能够容忍VACUUM FULL带来的更新冲突的误判断,也可以考虑。

转了一圈,最后我还是认为xmin是作为行版本号的最佳方案。

参考:

关于PostgreSQL中的几个系统隐藏列,可参考手册

http://58.58.27.50:8079/doc/html/9.3.1_zh/ddl-system-columns.html

------------------------------------------------------------------------

每个表都有几个系统字段,这些字段是由系统隐含定义的。因此, 这些名字不能用于用户定义的字段名。请注意这些限制与这个名字是否关键字无关, 把名字用引号括起来并不能让你逃离这些限制。你实际上不需要注意这些字段; 只要知道它们存在就可以了。

oid

tableoid

xmin

插入该行版本的事务标识(事务ID)。注意:在这个环境里,一个行版本是一行的一个状态; 一行的每次更新都为同一个逻辑行创建一个新的行版本。

cmin

在插入事务内部的命令标识(从零开始)。

xmax

删除事务的标识(事务ID),如果不是被删除的行版本,那么是零。在一个可见行版本里, 这个字段有可能是非零。这通常意味着删除事务还没有提交,或者是一个删除的企图被回滚掉了。

cmax

删除事务内部的命令标识符,或者是零。

ctid

一个行版本在它所处的表内的物理位置。请注意,尽管ctid 可以用于非常快速地定位行版本,但每次VACUUM FULL之后, 一个行的ctid都会被更新或者移动。因此ctid 是不能作为长期的行标识符的。应该使用 OID ,或者更好是用户定义的序列号,来标识一个逻辑行。