天天看点

数据库主从一致性架构设计实践

原文:https://mp.weixin.qq.com/s?__biz=MjM5ODYxMDA5OQ==&mid=2651959442&idx=1&sn=feb8ff75385d8031386e120ef3535329&mpshare=1&scene=1&srcid=0414Sfz5073uJ0LtONVjo8lR&key=58a327fab9b03b4d2d299413f7071fd84a44bcdb554512e8a13284f7639f4448181da21c9f104e837afb44e7549b5d0c73bdf2e31a78927d66ae345a4f3360eb3ea7b566808edfb74d8ecf70eccc5c3f&ascene=1&uin=MTc0NDg2MzA2MQ%3D%3D&devicetype=Windows+10&version=62060739&lang=zh_CN&pass_ticket=tW64Z%2F34hwZyRqWaBBwgDqdNjLnpWPiYL7A0nhfurpDF7xeaYQgdG22dV0k1VGKJ

作者: 58沈剑

需求缘起

大部分互联网的业务都是**“读多写少”的场景,数据库层面,读性能往往成为瓶颈**。如下图:业界通常采用 “一主多从,读写分离,冗余多个读库” 的数据库架构来提升数据库的读性能。

数据库主从一致性架构设计实践

这种架构的一个潜在缺点是,

业务方有可能读取到并不是最新的旧数据

数据库主从一致性架构设计实践

(1)系统先对DB-master进行了一个写操作,写主库

(2)很短的时间内并发进行了一个读操作,读从库,此时主从同步没有完成,故读取到了一个旧数据

(3)主从同步完成

有没有办法解决或者缓解这类 “由于主从延时导致读取到旧数据” 的问题呢,这是本文要集中讨论的问题。

方案一(半同步复制)

不一致是因为

写完成后,主从同步有一个时间差,假设是500ms,这个时间差有读请求落到从库上产生的

。有没有办法做到,等主从同步完成之后,主库上的写请求再返回呢?(因为写请求未完成,所以读到旧数据是正常的) 答案是肯定的,就是大家常说的“半同步复制”semi-sync:

数据库主从一致性架构设计实践

(1)系统先对DB-master进行了一个写操作,写主库

(2)等主从同步完成,写主库的请求才返回

(3)读从库,读到最新的数据(如果读请求先完成,写请求后完成,读取到的是“当时”最新的数据)

方案优点: 利用数据库

原生功能

,比较简单

方案缺点: 主库的

写请求时延会增长

吞吐量会降低

方案二(强制读主库)

如果不使用“增加从库”的方式来增加提升系统的读性能,完全可以读写都落到主库,这样就不会出现不一致了:

数据库主从一致性架构设计实践

方案优点:

“一致性”

不需要

进行系统改造

方案缺点: 只能通过

cache

来提升系统的

读性能

,这里要进行系统

改造

方案三(数据库中间件)

如果有了数据库中间件,所有的数据库请求都走中间件,这个主从不一致的问题可以这么解决:

数据库主从一致性架构设计实践

(1)所有的读写都走数据库中间件,通常情况下,写请求路由到主库,读请求路由到从库

(2)记录所有

路由到写库的key

,在

经验主从同步时间窗口

内(假设是500ms),如果有读请求访问中间件,此时有可能从库还是旧数据,就把

这个key上的读请求路由到主库

(3)

经验主从同步时间过完后

,对应key的

读请求

继续路由到

从库

方案优点: 能保证

绝对一致

方案缺点: 数据库中间件的

成本比较高

方案四(缓存记录写key法)

既然数据库中间件的成本比较高,有没有更低成本的方案来记录某一个库的某一个key上发生了写请求呢?很容易想到

使用缓存

,当写请求发生的时候:

(1)将某个库上的某个

key

要发生

写操作

记录在cache

里,并

设置“经验主从同步时间”

的cache超时时间,例如500m

(2)修改数据库

而读请求发生的时候:

数据库主从一致性架构设计实践

(1)先到cache里查看,对应库的对应key有没有相关数据

(2)如果

cache hit

,有相关数据,说明这个key上刚发生过写操作,此时需要将

请求路由到主库读

最新的数据

(3)如果

cache miss

,说明这个key上近期没有发生过写操作,此时将

请求路由到从库

,继续读写分离

方案优点: 相对数据库中间件,

成本较低

方案缺点: 为了保证“一致性”,

引入了一个cache组件

,并且读写数据库时都

多了一步cache操作

总结

为了解决主从数据库读取旧数据的问题,常用的方案有四种:

(1)半同步复制

(2)强制读主

(3)数据库中间件

(4)缓存记录写key

继续阅读