013.Redis Cluster架构原理

作者: CoderJed | 来源:发表于2020-03-23 19:12 被阅读0次

    1. Redis单master的瓶颈

    • master节点的数据和slave节点的数据是一模一样的,master节点的最多能容纳多少数据量,slave节点也就只能容纳这么多数据
    • 当数据量超过master的内存,redis会使用LRU算法清除部分数据
    • 如果确实要容纳更多的数据量,redis主从架构是无法解决这个问题的

    2. Redis Cluster架构原理

    2.1 Redis Cluster架构概述

    Redis Cluster是Redis的分布式解决方案,在3.0版本正式推出,解决单master架构的内存、并发、流量等瓶颈,以达到负载均衡的目的。

    • 每个master负责整个集群的一部分数据,每个节点负责数据多少可能不一样
    • 每个master的角色是对等的
    • 每个master节点都可以有N个slave节点,当一个master节点挂掉后,它的其中一个slave节点升级为master
    • redis cluster已经自动具备了主从复制能力,也就是说,我们不需要手动再去搭建主从+sentinel架构
    • redis cluster适用于海量数据、高并发、高可用场景

    2.2 Hash Slot算法

    (1) 分布式存储的数据分配算法

    • 按照顺序存储

      • 与业务相关,例如商品信息存在A节点,用户信息存在B节点,每个节点的数据可以排序
      • 容易造成数据倾斜
      • 代表产品:HBase
    • 散列存储

      • 离散度好,数据均匀分布,每个节点的数据量大致相同

      • 业务无关

      • 无法顺序访问

      • 代表产品:Redis Cluster

    分布式存储的hash算法演进

    (2) hash算法

    • 优点

      • 简单
    • 问题

      • 一旦某个master宕机,就需要调整hash算法,所有的数据都需要重新计算取模(由对3取模变成对2取模),然后重新分配数据
      • 发生这种故障时,在数据未重新分配之前,由于更换了hash算法,导致大部分的请求都无法正确的拿到数据,从而不得不去访问数据库,在高并发场景下,这样是不能接受的,所以目前分布式缓存不再使用此种算法分配数据
    • 适用场景

      常用于数据库的分库分表规则,采用预分区的方式,提前根据数据量规划好分区数,保证可支撑未来一段时间的数据量

    • 扩容方案

      通常采用翻倍扩容,避免数据映射全部被打乱导致全量迁移

    (3) 一致性hash算法

    • 实现思路
      • 每个节点被预先分配一个token(可以理解为它管理的hash值的边界),多个节点管理范围为[0, 2^32]的hash值范围
      • 数据读写时,先根据key求hash值,然后就知道此hash值在哪段范围内
      • 顺时针找到的节点就是其数据存储的节点
    • 问题
      • 加减节点会造成哈希环中部分数据(1/N的数据量,N为节点个数)无法命中,当一个master挂掉之后,例如master1挂掉,那么当请求从master1获取数据时,是获取不到的,于是继续顺时针去master2、master0获取数据,当然也是获取不到的,需要手动处理这些无法命中的数据
      • 节点数量越多,增减节点带来的影响越小,因此不适用与集群中只有少量节点的情况
      • 容易造成数据热点问题
    • 扩容方案
      • master的增减,需要增加一倍或者减少一倍,才能保证数据和负载的均衡

    (4) 优化后的一致性hash算法

    • 给master节点之间增加了均匀分布的虚拟节点
    • 如果某个区间内有大量的数据,顺时针找到的就是其他的虚拟节点,这样每个区间内的数据都会均匀的分配到不同的master中去

    (5) redis的hash slot算法

    • 实现原理

      • Redis Cluster使用16384个槽(slot)来管理一段整数集合(hash值),slot是集群内数据管理和迁移的基本单位

      • 每个master节点负责管理一部分slot,例如有5个节点,那个每个节点管理大约3276个槽

      • 对每个key使用CRC32算法进行hash得到一个整数值,然后使用hash值对16384进行取模,得到此数据应该分配到的slot编号,配置该slot即可被该slot的master管理

      • 每个master管理的slot的信息就缓存在本地,客户端连接集群时,会获取集群slot配置信息,从而通过key精确找到slot所在的节点

      • 可以强制指定某个key挂在指定的slot上

    • 优点

      • 解耦数据和节点之间的关系,简化了节点扩容和收缩难度,增加一个master,就让其他的master分一部分slot给新来的master管理,移除一个master,就把这个master管理的slot分配给其他的master

      • 某个master挂掉,不影响整个集群,因为请求是到slot,而不是到master,但在slot迁移完成之前,请求到挂掉的节点也是不行的

      • slot迁移的过程是很快的

      • 节点自身维护slot的映射关系,无需人为管理

      • 支持槽、节点、key之间的映射关系查询

    相关文章

      网友评论

        本文标题:013.Redis Cluster架构原理

        本文链接:https://www.haomeiwen.com/subject/kfchyqtx.html