美文网首页
Amazon Dynamo阅读笔记

Amazon Dynamo阅读笔记

作者: zczhuohuo | 来源:发表于2015-10-12 22:02 被阅读261次

    Amazon Dynamo阅读笔记

    论文主要内容

    • 系统架构
      • 系统接口
      • 分区算法
      • 复制
      • 数据版本
      • 系统接口的实现过程
      • 提示交移(hinted handoff)
      • membership and failure detection(经典理论)
      • 节点的增删
    • 实现
    • 经验
      • 如何平衡性能(performance)和持久性(durability)
      • 如何保证负载的在每一个节点上的均匀分布
      • 冲突的选择:是在服务度解决冲突还是在客户端解决冲突

    SLA

    在论文中,有专门的一节来讨论dynamo的SLA,所以,关于SLA值得记录一下。关于服务质量的衡量指标,一般来说可以用平均数来表示,例如用300ms的平均响应时间来表示。而dynamo却用了一个特别的衡量指标:99.9%的请求的响应时间少于300ms。注意,这跟用平均数有比较大的差别,因为用平均数,即使你的平均数很低,但也有可能有相当一部分请求的响应时间很高。

    改进的一致性哈希算法

    在传统的一致性哈希算法上,服务节点跟哈希环上的点是一一对应的。这里会存在一个问题,就是每一个节点的负载最后是不均匀的,而我们也无法进行调整。dynamo通过一个服务节点可以有多个哈希环上的虚拟节点的方法,使得每一个服务节点的负载都是均匀的。并且假如发现了某一个节点的负载过高,少分配虚拟节点给它便可以降低该服务节点的负载,从而实现了自动地负载均衡。

    时钟向量实现多版本数据

    在CAP中,dynamo选择了AP,牺牲了C。因此,dynamo中得数据必然存在不一致性。为了在数据不一致的冲突,dynamo给每一个数据附加了一个时钟向量来表示数据的版本。

    hinted handoff

    这是一个比较强悍的功能。dynamo为了保证服务的可用性,当一个节点down之后,本来应该路由到该节点的写依然可以被接受。这些写请求会被路由到哈希环上的下一个可用节点,然后对落地的数据标上记号,表示这个数据不是属于本节点的,而是属于A节点的(打个比方)。然后当A节点恢复之后,数据又会被复制到A节点。

    R + W > N

    N指备份数;R、W分别表示读和写请求的成功数。这条不等式的意思是我们可以配置不同的R、W、N来实现不同等级可用性和性能。

    相关文章

      网友评论

          本文标题:Amazon Dynamo阅读笔记

          本文链接:https://www.haomeiwen.com/subject/mydocttx.html