AOF持久化是通过保存Redis服务器所执行的写命令来记录数据库状态的
AOF的过程
image.png命令追加
当AOF持久化功能处于打开状态时,服务器在执行完一个写命令之后,会以协议格式将被执行的写命令追加到服务器状态的 aof_buf缓冲区的末尾∶
AOF文件的写入和同步
Redis的服务器进程就是一个事件循环(loop),这个循环中的文件事件负责接收客户端的命令请求,以及向客户端发送命令回复,而时间事件则负责执行像servercron函数这样需要定时运行的函数。
因为服务器在处理文件事件时可能会执行写命令,使得一些内容被追加到aof_buf缓冲区里面,所以在服务器每次结束一个事件循环之前,它都会调用flushAppendonlyFile函数,考虑是否需要将aof_buf缓冲区中的内容写人和保存到AOF文件里面,这个过程可以用以下伪代码表示∶
def eventLoop():
while True:
#处理文件事件,接收命令请求以及发送命令回复
#处理命令请求时可能会有新内容被追加到 aof_buf缓冲区中
processFileEvents()
#处理时间事件
processTimeEvents()
#考虑是否要将 aofbuf中的内容写入和保存到 AOF文件里面
flushAppendonlyFile()
flushAppendonlyFile()函数的行为是由服务器配置的appendfsync选项的值来决定:
always:将aof_buf缓冲区中的所有内容写入并同步到AOF文件
everysec:将aof_buf缓冲区中的所有内容写人到AOF文件,如果上次同步AOF文件的时间距离现在超过一秒钟,那么再次对AOF文件进行同步,并且这个同步操作是由一个线程专门负责执行的
no:将aof_buf缓冲区中的所有内容写入到AOF文件,但并不对AOF文件进行同步,何时同步由操作系统来决定
默认是everysec
几种选项的特点
always效率最低但是最安全
everysec 足够快,就算出现故障停机,数据库也只丢失一秒钟的命令数据
no 速度最快,不过因为这种模式会在系统缓存中积累一段时间的写入数据,所以该模式的单次同步时长通常是三种模式中时间最长的。从平摊操作的角度来看,no模式和everysec模式的效率类似,当出现故障停机时,使用no模式的服务器将丢失上次同步AOF文件之后的所有写命令数据。
AOF文件的载入和还原
image.pngAOF重写
因为AOF持久化是通过保存被执行的写命令来记录数据库状态的,所以随着服务器运行时间的流逝,AOF 文件中的内容会越来越多,文件的体积也会越来越大,如果不加以控制的话,体积过大的AOF文件很可能对Redis服务器、甚至整个宿主计算机造成影响,并且AOF文件的体积越大,使用AOF文件来进行数据还原所需的时间就越多。
为了解决AOF文件体积膨胀的问题,Redis提供了AOF文件重写(rewrite)功能。通过该功能,Redis服务器可以创建一个新的AOF文件来替代现有的AOF文件,新旧两个AOF文件所保存的数据库状态相同,但新 AOF文件不会包含任何浪费空间的冗余命令,所以新 AOF 文件的体积通常会比旧AOF文件的体积要小得多。
AOF文件重写并不需要对现有的AOF文件进行任何读取、分析或者写入操作,这个功能是通过读取服务器当前的数据库状态来实现的。
AOF重写这里有一个重要的优化,比如进行如下操作:
rpush list "a" "b"
rpush list "c"
rpush list "d" "e"
lpop list
lpop list
rpush list "f" "g"
正常的话需要保存所有的命令,而redis的AOF是这么做的,直接从数据库中读取键list的值,然后用一条rpush list "a" "b" "c" "d" "e" "f" "g"来代替。
在重写过程中会先检查键所包含的元素数量,如果元素的数量超过了redis.h/REDIS_AOF REWRITE_ITEMS_PER_CMD常量的值,那么重写程序将使用多条命令而不是一条命令。
在目前版本中,REDIS_AOF_REWRITE_ITEMS_PER_CMD常量的值为64,也就是说说,如果一个集合键包含了超过64个元素,那么重写程序会用多条SADD命令来记录这个集合,并且每条命令设置的元素数量也为64个。
AOF后台重写BGREWRITEAOF
BGREWRITEAOF是开一个子进程去重写AOF,主进程正常处理客户端请求,不过使用子进程也有问题需要解决:因为子进程在进程AOF重写期间,服务器进程还需要继续处理当前请求,而新的命令可能会对现有数据库状态进行修改,从而使得服务器当前的数据库状态和重写后的AOF文件所保存的数据库状态不一致。比如:
image.png
在子进程AOF文件重写之后,AOF中只有k1一个键,但是当前数据库中已经多出了k2 k3 k4 三个键。造成了AOF文件和当前数据库状态不一致的情况。
解决
为了解决这种数据不一致问题,Redis服务器设置了一个AOF重写缓冲区,这个缓冲区在服务器创建子进程之后开始使用,当Redis服务器执行完一个写命令之后,它会同时将这个写命令发送给 AOF缓冲区和AOF重写缓冲区,如图所示。
image.png
当子进程完成 AOF重写工作之后,它会向父进程发送一个信号,父进程在接到该信号之后,会调用一个信号处理函数,并执行以下工作∶
1)将AOF重写缓冲区中的所有内容写人到新AOF文件中,这时新AOF文件所保存的数据库状态将和服务器当前的数据库状态一致。
2)对新的AOF文件进行改名,原子地(atomic)覆盖现有的AOF文件,完成新旧两个 AOF文件的替换。
这个信号处理函数执行完毕之后,父进程就可以继续像往常一样接受命令请求了。
在上面的例子当中,子进程重写完成向服务器进程发送信号之后,服务器进程会将AOF重写缓冲区中的k2 k3 k4追加到新AOF文件的结尾,然后用新的AOF文件替换旧AOF文件。
网友评论