全局唯一递增的id_高并发环境下系统生成全局唯一ID

最近在proxy的分库分表，需要给表中的主字段产生一个全局唯一ID，考虑到后期DBA会拿这个ID做索引的，所以产生的这个ID也要尽可能的有序，总体要求如下

不能有单点问题...

全局唯一且有序

尽量64位可以表示

于是乎调研了一下，貌似有几个典型的代表

twitter的snowflake

生成方式：

41位的时间序列(ms, 大约可以用69年)

10位的机器标志(大约可以支持部署1024台机器, 5bit设置为机器ID，5bit设置为进程ID)

12位的计数顺序号(这就决定了每个节点的并发不超过4096)

最高位作为符号位，始终为0

全局唯一递增的id_高并发环境下系统生成全局唯一ID

913887-20160325101451339-2081640491.jpg

优点：高性能，低延迟，基本能按时间有序，需要独立的开发和部署

很明显，这个缺点在proxy那边来看并不是缺点，我就是参考他的思路，把这部分的实现放在proxy的

基于Mysql的解决方案

因为MySQL本身支持auto_increment操作，很自然地，我们会想到借助这个特性来实现这个功能。

Flicker在解决全局ID生成方案里就采用了MySQL自增长ID的机制(auto_increment + replace into + MyISAM)。一个生成64位ID

方案具体就是这样的：

先创建单独的数据库，然后创建一个表：

CREATE TABLE Tickets64 (

id bigint(20) unsigned NOT NULL auto_increment,

stub char(1) NOT NULL default '',

PRIMARY KEY (id),

UNIQUE KEY stub (stub)

) ENGINE=MyISAM

然后插入一条记录，并插入一条记录，执行执行SELECT * from Tickets64查询的结果就是这样的：

+-------------------+------+

| id | stub |

+-------------------+------+

| 72157623227190423 | a |

+-------------------+------+

在我们的应用端需要做下面这两个操作，在一个事务会话里提交

REPLACE INTO Tickets64 (stub) VALUES ('a');

SELECT LAST_INSERT_ID();

这样我们就能拿到不断增长且不重复的ID了。

到上面为止，我们只是在单台数据库上生成ID，从高可用角度考虑，接下来就要解决单点故障问题：Flicker启用了两台数据库服务器来生成ID，通过区分auto_increment的起始值和步长来生成奇偶数的ID

TicketServer1:

auto-increment-increment = 2

auto-increment-offset = 1

TicketServer2:

auto-increment-increment = 2

auto-increment-offset = 2

最后，在客户端只需要通过轮询方式取ID就可以了。

优点：充分借助数据库的自增ID机制，提供高可靠性，生成的ID有序。

缺点：占用两个独立的MySQL实例，依赖外部服务，难运维

UUID

UUID生成的是length=32的16进制格式的字符串，如果回退为byte数组共16个byte元素，即UUID是一个128bit长的数字，

一般用16进制表示。

算法的核心思想是结合机器的网卡、当地时间、一个随即数来生成UUID。

从理论上讲，如果一台机器每秒产生10000000个GUID，则可以保证(概率意义上)3240年不重复

优点：

本地生成ID，不需要进行远程调用，时延低

扩展性好，基本可以认为没有性能上限

缺点：

无法保证趋势递增

uuid过长，往往用字符串表示，作为主键建立索引查询效率低，常见优化方案为“转化为两个uint64整数存储”或者“折半存储”(折半后不能保证唯一性)

UUID这两个致命缺点导致我们首先抛弃UUID

基于REDIS的分布式ID生成器

首先，要知道redis的EVAL，EVALSHA命令：

原理：

利用redis的lua脚本执行功能，在每个节点上通过lua脚本生成唯一ID。

生成的ID是64位的：

使用41 bit来存放时间，精确到毫秒，可以使用41年。

使用12 bit来存放逻辑分片ID，最大分片ID是4095

使用10 bit来存放自增长ID，意味着每个节点，每毫秒最多可以生成1024个ID

比如GTM时间 Fri Mar 13 10:00:00 CST 2015 ，它的距1970年的毫秒数是 1426212000000，假定分片ID是53，自增长序列是4，则生成的ID是：

5981966696448054276 = 1426212000000 << 22 + 53 << 10 + 41

redis提供了TIME命令，可以取得redis服务器上的秒数和微秒数。因些lua脚本返回的是一个四元组:

(second, microSecond, partition, seq)

客户端可以自己处理

((second * 1000 + microSecond / 1000) << (12 + 10)) + (shardId << 10) + seq

MongoDB文档(Document)全局唯一ID

为了考虑分布式，“_id”要求不同的机器都能用全局唯一的同种方法方便的生成它。因此不能使用自增主键(需要多台服务器进行同步，既费时又费力)，

因此选用了生成ObjectId对象的方法。

ObjectId使用12字节的存储空间，其生成方式如下：

|0|1|2|3|4|5|6|7|8|9|10|11|

|时间戳 |机器ID|PID|计数器|

前四个字节时间戳是从标准纪元开始的时间戳，单位为秒，有如下特性：

时间戳与后边5个字节一块，保证秒级别的唯一性；

保证插入顺序大致按时间排序；

隐含了文档创建时间；

时间戳的实际值并不重要，不需要对服务器之间的时间进行同步(因为加上机器ID和进程ID已保证此值唯一，唯一性是ObjectId的最终诉求)。

机器ID是服务器主机标识，通常是机器主机名的散列值。

同一台机器上可以运行多个mongod实例，因此也需要加入进程标识符PID。

前9个字节保证了同一秒钟不同机器不同进程产生的ObjectId的唯一性。后三个字节是一个自动增加的计数器(一个mongod进程需要一个全局的计数器)，保证同一秒的ObjectId是唯一的。同一秒钟最多允许每个进程拥有(256^3 = 16777216)个不同的ObjectId。

总结一下：时间戳保证秒级唯一，机器ID保证设计时考虑分布式，避免时钟同步，PID保证同一台服务器运行多个mongod实例时的唯一性，最后的计数器保证同一秒内的唯一性(选用几个字节既要考虑存储的经济性，也要考虑并发性能的上限)。

"_id"既可以在服务器端生成也可以在客户端生成，在客户端生成可以降低服务器端的压力。

一个小实现，已经用在AtlasV2中

全局唯一递增的id_高并发环境下系统生成全局唯一ID

继续阅读

全局唯一递增的id_如何生成全局唯一ID

全局唯一递增的id_全局唯一ID生成方案

全局唯一递增的id_浅谈全局唯一ID的生成方案