天天看点

Amazon DynamoAmazon Dynamo阅读笔记

Amazon Dynamo阅读笔记

论文主要内容

  • 系统架构
    • 系统接口
    • 分区算法
    • 复制
    • 数据版本
    • 系统接口的实现过程
    • 提示交移(hinted handoff)
    • membership and failure detection(经典理论)
    • 节点的增删
  • 实现
  • 经验
    • 如何平衡性能(performance)和持久性(durability)
    • 如何保证负载的在每一个节点上的均匀分布
    • 冲突的选择:是在服务度解决冲突还是在客户端解决冲突

SLA

在论文中,有专门的一节来讨论dynamo的SLA,所以,关于SLA值得记录一下。关于服务质量的衡量指标,一般来说可以用平均数来表示,例如用300ms的平均响应时间来表示。而dynamo却用了一个特别的衡量指标:99.9%的请求的响应时间少于300ms。注意,这跟用平均数有比较大的差别,因为用平均数,即使你的平均数很低,但也有可能有相当一部分请求的响应时间很高。

改进的一致性哈希算法

在传统的一致性哈希算法上,服务节点跟哈希环上的点是一一对应的。这里会存在一个问题,就是每一个节点的负载最后是不均匀的,而我们也无法进行调整。dynamo通过一个服务节点可以有多个哈希环上的虚拟节点的方法,使得每一个服务节点的负载都是均匀的。并且假如发现了某一个节点的负载过高,少分配虚拟节点给它便可以降低该服务节点的负载,从而实现了自动地负载均衡。

时钟向量实现多版本数据

在CAP中,dynamo选择了AP,牺牲了C。因此,dynamo中得数据必然存在不一致性。为了在数据不一致的冲突,dynamo给每一个数据附加了一个时钟向量来表示数据的版本。

hinted handoff

这是一个比较强悍的功能。dynamo为了保证服务的可用性,当一个节点down之后,本来应该路由到该节点的写依然可以被接受。这些写请求会被路由到哈希环上的下一个可用节点,然后对落地的数据标上记号,表示这个数据不是属于本节点的,而是属于A节点的(打个比方)。然后当A节点恢复之后,数据又会被复制到A节点。

R + W > N

N指备份数;R、W分别表示读和写请求的成功数。这条不等式的意思是我们可以配置不同的R、W、N来实现不同等级可用性和性能。