Redis 分布式实践——Redis Cluster 集群

作者: Java程序员YY | 来源:发表于2019-08-17 16:15 被阅读2次

    Redis Cluster(集群)是官方提供的集群功能。Redis 在 3.0 版本中提供了 Redis Cluster 来满足分布式的需求。

    为什么需要集群?

    并发量,据 Redis 官方测试,有 50 个并发程序来执行 10 万次请求,Redis 读的速度达到了 11 万次/秒,写的速度达到了 8.1 万次/秒。那如果业务需要 100 万次/秒呢?

    数据量,一台生产机器内存一般在 16G~256G,如果业务需要 500G 数据呢?

    这些问题引出了 Redis Cluster。

    1.数据分布

    分布式数据库 - 数据分区:

    常用的两种分区方式是顺序分区(按顺序进行分区)和哈希分区(key 取哈希值进行分区)。

    哈希分区主要有三种:

    1.节点取余分区

    客户端分片,分区位置 = hash(key) % nodes,nodes 指节点数,有一个问题就是如果扩容,约 80% 的数据会做漂移,如果是翻倍扩容,约 50% 的数据会做漂移,大量的漂移会影响系统性能,建议翻倍扩容。

    2.一致性哈希分区

    客户端分片,分区位置 = hash(key) + 顺时针(优化取余),是对节点取余分区的一个优化,为数据做一个 token 环,token = 0 ~ 2 的 32 次方,然后为每一个节点分配一个 token 范围,然后根据 hash(key) 值顺时针去找节点名。

    如果在 node1 和 node2 之间加一个 node5,node1 到 node5 之间的哈希就会落在 node5 上了,数据仍然会存在漂移,但是有一个好处是,添加节点后,不会影响 node1、node3、node4 的数据,影响范围会小很多。随着节点数量的增加,漂移影响范围也会越来越小。适合节点比较多的情况。

    3.虚拟槽分区

    预设虚拟槽:每个槽映射一个数据子集,一般比节点数大。

    Redis Cluster 使用的分区方式,服务端(Redis)分片。Redis Cluster 中有一个16384(0~16383)长度的虚拟槽。

    分区位置 = hash(key) % 16383。

    虚拟槽分配:

    像节点取余分区和一致性哈希分区都有一个问题,就是添加节点之后,数据会进行漂移,存在丢数据的可能性,只能作为缓存场景来使用。而虚拟槽分区是不存在这样的问题的,因为每个槽负责的范围是固定的,加了新节点,也不会把其他节点的槽抢过去。

    2.基本架构

    节点:Redis Cluster 中会有多个节点,节点之间是相互通信的,且每个节点都负责读写。

    meet 操作(gossip 协议):节点之间相互通信的基础。假如现在有 5 个节点,node1 节点对 node2、node3、node4、node5 节点分别发送了一个 meet 操作,node2 等节点会各自返回一个 pong 命令(表示 Redis 服务运行正常),其他节点可以自动找到,最终所有节点都可以相互通信。

    分配槽:需要给节点分配虚拟槽。

    对于客户端来说,只需要计算 slot = hash(key) %16383。

    复制:为了保证高可用,每一个节点都有一个 slave 节点。

    3.搭建集群

    配置开启 Redis,原生命令安装和官方工具安装这一步是一样的。这里 Redis 五个节点用五个端口进行区分,分别是 7000、7001、7002、7003、7004。

    Redis 节点 redis/config/redis-7000.conf 配置(redis.conf 模板文件在 redis/redis.conf,这里只给出一个节点配置,其余节点只能端口号不同):

    # 关闭保护模式

    protected-mode no

    # 配置启动端口

    port 7000

    # 配置后台启动

    daemonize yes

    # 修改pidfile指向路径 redis-${port}.pid

    pidfile /var/run/redis-7000.pid

    # 日志记录方式 redis-${port}.log

    logfile "redis-7000.log"

    # 配置dump数据存放目录

    dir "/opt/soft/redis/data/"

    # 配置dump数据文件名 redis-${port}.rdb

    dbfilename dump-7000.rdb

    # 开启集群模式

    cluster-enabled yes

    # cluster节点超时时间,毫秒

    cluster-node-timeout 15000

    # cluster配置文件

    cluster-config-file "nodes-7000.conf"

    # 是否需要集群内所有节点都能提供服务才认为集群是正确的,默认yes

    cluster-require-full-coverage no

    启动命令:

    # redis-server redis-7000.conf

    继续操作,分别启动剩余 7001、7002、7003、7004 端口的节点。此时各个节点没有进行任何通信,各自都是孤立的。

    1.原生命令安装(理解架构)

    首先进行 meet 操作(gossip 协议):

    # redis-cli -h 127.0.0.1 -p 7000 cluster meet 127.0.0.1 -p 7001 //在 7000 上执行命令,7000 端口的 redis 节点 meet 7001端口的 redis 节点

    # redis-cli -h 127.0.0.1 -p 7000 cluster meet 127.0.0.1 -p 7002

    # redis-cli -h 127.0.0.1 -p 7000 cluster meet 127.0.0.1 -p 7003

    # redis-cli -h 127.0.0.1 -p 7000 cluster meet 127.0.0.1 -p 7004

    然后分配槽:

    # redis-cli -h 127.0.0.1 -p 7000 cluster addslots {0...3276} //在 7000 上执行命令

    # redis-cli -h 127.0.0.1 -p 7001 cluster addslots {3277...6553}

    # redis-cli -h 127.0.0.1 -p 7002 cluster addslots {6554...9829}

    # redis-cli -h 127.0.0.1 -p 7003 cluster addslots {9830...13105}

    # redis-cli -h 127.0.0.1 -p 7004 cluster addslots {13106...16383}

    这样所有槽分配之后,集群就算基本建立完成了。

    最后需要设置主从(只有有了主从关系后,才可以实现故障自动转移):

    # redis-cli -h 127.0.0.1 -p 8000 cluster replicate ${node-id-7000} //在 8000 上执行命令

    node-id 是指集群的一个节点 id,在集群启动的时候就会进行分配,需要注意的是,这里的 node-id 非单机节点的 runid,runid 重启会重置,node-id 重启不会重置。

    2.官方工具安装(生产推荐)

    Redis Cluster 官方提供了 Ruby 的安装脚本,相比于原生命令安装要容易很多。

    Linux 上安装 Ruby 环境:

    # wget -P /usr/local http://cache.ruby-lang.org/pub/ruby/2.6/ruby-2.6.3.tar.gz

    # cd /usr/local

    # tar -zxvf ruby-2.6.3.tar.gz //解压缩

    # cd ruby-2.6.3

    # ./configure -prefix=/usr/local/ruby //配置

    # make

    # make install //安装

    # cd /usr/local/ruby

    # cp bin/ruby /usr/local/bin

    # cp bin/gem /usr/local/bin

    安装 Ruby Redis 客户端:

    # wget -P /usr/local http://rubygems.org/downloads/redis-4.1.2.gem

    # cd /usr/local

    # gem install -l redis-4.1.2.gem //安装rubygem redis

    # gem list --check redis gem

    # cp /usr/local/redis/src/redis-trib.rb /usr/local/bin //安装redis-trib.rb

    redis-trib 安装 Redis Cluster:

    一键开启:

    ./redis-trib.rb create --replicas 1 127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.

    这个命令表示创建集群,–replicas 1 表示每个主节点配备一个从节点,前五个 7000 到 7004 的端口表示主节点,后五个 8000 到 8004 的端口表示从节点,7000 对应 8000,7001 对应 8001,以此类推。

    相比原生命令安装,官方工具安装更高效、准确,生成环境可使用。

    4.集群伸缩

    1.伸缩原理

    一个 node1、node2、node3 组成的集群,加入 node4 的过程,其实就是槽和数据在节点之间的移动。

    2.扩容集群

    127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 组成的集群,加入 127.0.0.1:7003。

    1.原生命令安装(理解架构)

    1、准备新节点

    需要新节点是集群模式(cluster-enabled yes),配置需要和其他节点统一,然后启动改节点。

    2、加入集群

    通过 meet 操作(gossip 协议)来完成的:

    # redis-cli -h 127.0.0.1 -p 7000 cluster meet 127.0.0.1 -p 7003 //在 7000 上执行命令,7000 端口的 redis 节点 meet 7003端口的 redis 节点

    # redis-cli -h 127.0.0.1 -p 7000 cluster nodes //加入集群,观察集群配置

    3、迁移槽和数据

    首先进行槽迁移计划,平均槽数据,计算每个节点应该迁移到新节点的槽的数量。

    然后迁移数据,迁移数据的过程是比较复杂的:

    1)对目标节点发送 cluster setslot {slot} importing {sourceNodeId} 命令,让目标节点准备导入槽数据;

    2)对源节点发送 cluster setslot {slot} migrating {targetNodeId} 命令,让源节点准备迁出槽的数据;

    3)源节点循环执行 cluster getkeysinslot {slot} {count} 命令,每次获取 count 个属于槽的键;

    4)在源节点上执行 migrate {targetIp} {targetPort} key 0 {timeout} 命令把指定 key 迁移;

    5)重复执行 3~4 直到槽下所有的键数据迁移到模板节点;

    6)向集群内所有 master 节点发送 cluster setslot {slot} node {targetNodeId} 命令,通知槽分配给目标节点。

    迁移数据的完整流程图:

    4、添加从节点

    2.官方工具安装(生产推荐)

    扩容集群命令:./redis-trib.rb add-node new_host:new_port existing_host:existing_port --slave --master-id < arg>

    # ./redis-trib.rb add-node 127.0.0.1:7003 127.0.0.1:7000

    建议使用 redis-trib.rb,能够避免新节点已经加入了其他集群,造成故障。

    建议使用 redis-trib.rb,能够避免新节点已经加入了其他集群,造成故障。

    2.缩容集群

    127.0.0.1:7000 127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 组成的集群,缩容 127.0.0.1:7003。

    1.原生命令安装(理解架构)

    1、下线迁移槽

    将下线节点持有的槽均匀的迁移到其他节点,迁移命令跟扩容集群的命令相同,不再赘述。

    2、忘记节点

    # redis-cli -h 127.0.0.1 -p 7000 cluster forget 7003 //在7000节点上执行,让7000忘记7003节点

    、关闭节点

    2.官方工具安装(生产推荐)

    1、集群缩容

    集群缩容命令:

    # ./redis-trib.rb reshard --from {7003 nodeid} --to {7000…7002 nodeid} --slots 1366 127.0.0.1:7003 //任一端口上执行,分别迁移槽位到之前的三个主节点

    建议使用 redis-trib.rb,能够避免新节点已经加入了其他集群,造成故障。

    2、下线节点

    先下线从节点,再下线主节点。

    # ./redis-trib.rb del-node 127.0.0.1:7000 {7003nodeid}

    # ./redis-trib.rb del-node 127.0.0.1:7000 {8003nodeid}

    下线节点包含了从集群中 remove 节点、从集群中 forget 节点、shutdown 节点。

    3、忘记节点

    # redis-cli -h 127.0.0.1 -p 7000 cluster forget {nodeId}

    # redis-cli -p cluster slots //查看节点情况

    5.客户端路由

    1.moved重定向

    moved 异常:

    槽命中,直接返回:

    槽不命中,moved 异常:

    2.ask重定向

    在集群扩容缩容的时候,会对槽进行迁移,槽的迁移是遍历槽中的 key,然后逐步执行 migrate 命令把指定 key 迁移,这个操作本身是比较慢的,假如此时客户端记录了槽的信息是在源节点,此时去访问,发现 key 已经迁移到目标节点了,这个时候就引出了 ask 重定向。

    ask 异常:

    moved 重定向和 ask 重定向两者都是客户端重定向,不同是 moved 槽已经确定迁移,ask 槽还在迁移中 。

    3.smart客户端

    1、smart 客户端使用:例如 Java 客户端 JedisCluster。

    2、smart 客户端原理

    smart 客户端首要目标就是追求性能,不可以使用代理模式(影响性能),Redis 作者建议直连对应槽的节点,但是碰到 moved 异常和 ask 异常需要做兼容,基本过程是这样的:

    从集群中选一个可运行节点,执行 cluster slots 命令初始化槽和节点映射;

    将 cluster slots 的结果映射到本地,为每个节点创建 JedisPool;

    准备执行命令。

    执行命令的基本过程:

    3、JedisCluster 执行源码分析

    打开 JedisCluster 类,看下 set 方法的实现:

    @Override

    public String set(final String key, final String value) {

    return new JedisClusterCommand(connectionHandler, maxAttempts) {

    @Override

    public String execute(Jedis connection) {

    return connection.set(key, value);

    }

    }.run(key);

    }

    可以看到使用了一个匿名内部类然后进行封装,跟进去看下 JedisClusterCommand 的实现:

    public abstract class JedisClusterCommand {

    /**

    * 在cluster初始化的时候,它会帮我们初始化所有的槽和节点的对应关系

    */

    private final JedisClusterConnectionHandler connectionHandler;

    /**

    * 最大尝试次数

    */

    private final int maxAttempts;

    public JedisClusterCommand(JedisClusterConnectionHandler connectionHandler, int maxAttempts) {

    this.connectionHandler = connectionHandler;

    this.maxAttempts = maxAttempts;

    }

    public abstract T execute(Jedis connection);

    public T run(String key) {

    if (key == null) {

    throw new JedisClusterException("No way to dispatch this command to Redis Cluster.");

    }

    return runWithRetries(JedisClusterCRC16.getSlot(key), this.maxAttempts, false, null);

    }

    private T runWithRetries(final int slot, int attempts, boolean tryRandomNode, JedisRedirectionException redirect) {

    // 尝试初始化的次数,attempts默认传入5

    if (attempts <= 0) {

    throw new JedisClusterMaxRedirectionsException("Too many Cluster redirections?");

    }

    // jedis连接

    Jedis connection = null;

    try {

    // 第一次执行的时候redirect是null

    if (redirect != null) {

    connection = this.connectionHandler.getConnectionFromNode(redirect.getTargetNode());

    if (redirect instanceof JedisAskDataException) {

    // Ask异常

    // TODO: Pipeline asking with the original command to make it faster....

    connection.asking();

    }

    } else {

    // 是否尝试随机节点,第一次执行的时候tryRandomNode是false

    if (tryRandomNode) {

    connection = connectionHandler.getConnection();

    } else {

    // 通过JedisClusterCRC16.getSlot(key)算出key对应的槽,通过槽获取对应的连接

    connection = connectionHandler.getConnectionFromSlot(slot);

    }

    }

    // 执行命令

    return execute(connection);

    // 无节点可达,直接抛出异常

    } catch (JedisNoReachableClusterNodeException jnrcne) {

    throw jnrcne;

    // 连接异常

    } catch (JedisConnectionException jce) {

    // 释放当前连接

    releaseConnection(connection);

    connection = null;

    if (attempts <= 1) {

    //We need this because if node is not reachable anymore - we need to finally initiate slots

    //renewing, or we can stuck with cluster state without one node in opposite case.

    //But now if maxAttempts = [1 or 2] we will do it too often.

    //TODO make tracking of successful/unsuccessful operations for node - do renewing only

    //if there were no successful responses from this node last few seconds

    // 刷新本地slot缓存

    this.connectionHandler.renewSlotCache();

    }

    return runWithRetries(slot, attempts - 1, tryRandomNode, redirect);

    // 重定向异常

    } catch (JedisRedirectionException jre) {

    // if MOVED redirection occurred,

    if (jre instanceof JedisMovedDataException) {

    // it rebuilds cluster's slot cache recommended by Redis cluster specification

    this.connectionHandler.renewSlotCache(connection);

    }

    // release current connection before recursion

    releaseConnection(connection);

    connection = null;

    return runWithRetries(slot, attempts - 1, false, jre);

    } finally {

    // 释放当前连接

    releaseConnection(connection);

    }

    }

    }

    执行命令就回到 JedisCluster 类,看下 execute 这个模板方法:

    @Override

    public String set(final String key, final String value) {

    return new JedisClusterCommand(connectionHandler, maxAttempts) {

    @Override

    public String execute(Jedis connection) {

    return connection.set(key, value);

    }

    }.run(key);

    }

    这样就完成了一次 Redis 命令的操作。


    小编这里整理了更多相关的 学习资料和 学习视频,可免费领取。

    加 VX:18410263200    通过验证备注:111(备注必填,方便通过)

    相关文章

      网友评论

        本文标题:Redis 分布式实践——Redis Cluster 集群

        本文链接:https://www.haomeiwen.com/subject/bflksctx.html