Redis的复制功能包括同步和命令传播两个方面内容,
- 同步,salve执行slaveof命令之后,将slave服务器的状态更新至主服务器当前的状态,即slave从master同步master的存量数据的过程;
- 命令传播,用于主服务器上的状态被修改导致主从服务器之间的数据库状态不一致时,让主从服务器重新回到一致状态。
全量同步过程
- 从服务器执行slaveof命令;
- 从服务器向主服务器发送pysync命令;
- 收到sync命令的主服务器执行BGSAVE命令开始生成RDB文件,并且用一块缓冲区来记录从现在开始执行的所有写命令;
- 当RDB文件生成完毕之后,主服务器将RDB文件发送给从服务器,从服务器接受并载入RDB文件,将自己的服务器状态更新至主服务器执行BGSAVE时的状态;
- 主服务器将记录在缓冲区中的所有写命令发送给从服务器,从服务器执行这些命令,将数据库状态同步到主服务器当前的状态。
如果从服务器网络异常与主服务器断开连接,通过自动重连与主服务器重新建立了连接,此时如果主服务器执行了写操作,那么重连的从服务器的状态与主服务器的状态不一致,此时应该如何进行同步?
Redis中的同步分为全量同步和部分同步,上述同步过程就是全量同步的过程,通常发生在从节点第一次与主节点建立连接或者从节点落后主节点太多的情况下,但是这种方法比较消耗资源,所以出现了部分不同的方式来处理网络抖动带来的不一致情况,
部分同步只需要处理从服务器落后主服务器的那部分数据就可以了。
部分同步的实现
部分同步依赖于三个重要的组件
- 主从服务器的复制偏移量(replication offset)
主服务器每次向从服务器传播N个字节的数据时,就将自己复制偏移量加上N,从服务器每次接收到主服务器发送过来的N个字节的数据时,就将自己的复制偏移量加上N,通过判断主服务器和从服务器复制偏移量的大小就能判定从服务器是否与主服务器保持一致,若相等则一致,若不相等则不一致。 - 主服务器的复制积压缓冲区(replication backlog)
复制缓冲区是由主服务器维护的一个长度固定的先进先出的队列,保存着最近传播的写命令,并且复制积压缓冲区会对队列中的每个字节记录相应的复制偏移量。当从服务器重新连接主服务器时,
pysync会将从服务器的复制偏移量offset发送给主服务器,如果offset会的数据全部存在于复制积压缓冲区中,那么执行部分同步操作,如果offset之后的数据不存在与缓冲区中,那么执行全量的同步操作; - 服务器的运行ID(run ID)
每个Redis服务器实例启动时都会生成一个运行id,有40个随机的16进制字符组成,当从服务器初次进行复制时,主服务器会将自己的run ID发送给从服务器,从服务器会将这个id保存起来,重连后将该id发送给主服务器,如果该id与当前主服务器的run ID相同,则可以尝试进行部分同步,如果不相同则进行全量的同步。
如下所示,执行INFO replication命令,可以查看复制状态,
# Replication
role:master
connected_slaves:2
slave0:ip=10.89.232.12,port=6389,state=online,offset=104223804,lag=0
slave1:ip=10.89.232.85,port=6389,state=online,offset=104223804,lag=1
master_replid:785665f3ce0213c95a01fc3bde68a14bfba71808
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:104223804
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:103175229
repl_backlog_histlen:1048576
当前服务器有两个slave,三个服务器的offset相等表明当前slave与master保持同步,复制积压缓冲区的大小设置为1048576个字节。
复制过程
复制主要包括如下步骤:
- 设置主服务器的地址和端口;
- 建立套接字链接;
- 发送PING命令;
- 身份验证;
- 发送端口信息;
- 同步;
- 命令传播
网友评论