Amazon Dynamo阅读笔记
论文主要内容
- 系统架构
- 系统接口
- 分区算法
- 复制
- 数据版本
- 系统接口的实现过程
- 提示交移(hinted handoff)
- membership and failure detection(经典理论)
- 节点的增删
- 实现
- 经验
- 如何平衡性能(performance)和持久性(durability)
- 如何保证负载的在每一个节点上的均匀分布
- 冲突的选择:是在服务度解决冲突还是在客户端解决冲突
SLA
在论文中,有专门的一节来讨论dynamo的SLA,所以,关于SLA值得记录一下。关于服务质量的衡量指标,一般来说可以用平均数来表示,例如用300ms的平均响应时间来表示。而dynamo却用了一个特别的衡量指标:99.9%的请求的响应时间少于300ms。注意,这跟用平均数有比较大的差别,因为用平均数,即使你的平均数很低,但也有可能有相当一部分请求的响应时间很高。
改进的一致性哈希算法
在传统的一致性哈希算法上,服务节点跟哈希环上的点是一一对应的。这里会存在一个问题,就是每一个节点的负载最后是不均匀的,而我们也无法进行调整。dynamo通过一个服务节点可以有多个哈希环上的虚拟节点的方法,使得每一个服务节点的负载都是均匀的。并且假如发现了某一个节点的负载过高,少分配虚拟节点给它便可以降低该服务节点的负载,从而实现了自动地负载均衡。
时钟向量实现多版本数据
在CAP中,dynamo选择了AP,牺牲了C。因此,dynamo中得数据必然存在不一致性。为了在数据不一致的冲突,dynamo给每一个数据附加了一个时钟向量来表示数据的版本。
hinted handoff
这是一个比较强悍的功能。dynamo为了保证服务的可用性,当一个节点down之后,本来应该路由到该节点的写依然可以被接受。这些写请求会被路由到哈希环上的下一个可用节点,然后对落地的数据标上记号,表示这个数据不是属于本节点的,而是属于A节点的(打个比方)。然后当A节点恢复之后,数据又会被复制到A节点。
R + W > N
N指备份数;R、W分别表示读和写请求的成功数。这条不等式的意思是我们可以配置不同的R、W、N来实现不同等级可用性和性能。