简介
RDB是Redis用来进行持久化的一种方式,是把当前内存中的数据集快照写入磁盘,也就是 Snapshot 快照
(数据库中所有键值对数据)。恢复时是将快照文件直接读到内存里。
备份是如何执行的
Redis会单独创建(fork)一个子进程
来进行持久化
,会先将数据写入到 一个临时文件
中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件
。 整个过程中,主进程是不进行任何IO操作
的,这就确保了极高的性能 如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失
。
Fork
-
Fork
的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等) 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。 - 在Linux程序中,
fork()
会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,Linux中引入了写时复制技术
。 - 一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
RDB持久化流程
RDB持久化流程dump.rdb文件
在redis.conf
中配置文件名称,默认为dump.rdb
,rdb文件的保存路径,也可以修改。默认为Redis启动时命令行所在的目录下。
触发方式
RDB 有两种触发方式,分别是自动触发和手动触发。
①、自动触发
在 redis.conf 配置文件中的 SNAPSHOTTING 下。
image.png
-
save
:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave(这个命令下面会介绍,手动触发RDB持久化的命令)。当然如果你只是用Redis的缓存功能,不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。可以直接一个空字符串来实现停用:save ""
默认如下配置:
save 900 1:表示900 秒内如果至少有 1 个 key 的值变化,则保存
save 300 10:表示300 秒内如果至少有 10 个 key 的值变化,则保存
save 60 10000:表示60 秒内如果至少有 10000 个 key 的值变化,则保存
-
stop-writes-on-bgsave-error
:默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了。如果Redis重启了,那么又可以重新开始接收数据了。 -
rdbcompression
:默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果是的话,redis会采用LZF算法
进行压缩。如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能,但是存储在磁盘上的快照会比较大。 -
rdbchecksum
:默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法
来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。 -
dbfilename
:设置快照的文件名,默认是dump.rdb
。 -
dir
:设置快照文件的存放路径,这个配置项一定是个目录
,而不能是文件名。默认是和当前配置文件保存在同一目录。 - 也就是说通过在配置文件中配置的
save
方式,当实际操作满足该配置形式时就会进行RDB 持久化
,将当前的内存快照保存在dir
配置的目录中,文件名由配置的dbfilename
决定。
②、手动触发
-
save
:该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止。显然该命令对于内存比较大的实例会造成长时间阻塞,这是致命的缺陷,为了解决此问题,Redis提供了第二种方式。 -
bgsave
:执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求
。具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束。阻塞只发生在fork阶段,一般时间很短。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令
,可以通过lastsave 命令获取最后一次成功执行快照的时间。
ps:执行执行 flushall
命令,也会产生dump.rdb文件,但里面是空的。
备份与恢复
- 可以先通过
config get dir
命令获取redis 的安装目录。 - 将备份文件 (dump.rdb) 移动到 redis 安装目录并启动服务即可,redis就会自动加载文件数据至内存了。Redis 服务器在载入 RDB 文件期间,会一直处于
阻塞
状态,直到载入工作完成为止。
看到如下标识,说明加载成功:
image.png
RDB 的优势和劣势
优势
- RDB是一个非常紧凑(compact)的文件,它保存了redis 在某个时间点上的数据集。这种文件非常适合用于进行
备份和灾难恢复
。 - 生成RDB文件的时候,redis主进程会
fork()
一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。 - RDB 在恢复大数据集时的速度比
AOF
的恢复速度要快。
劣势
- RDB方式数据没办法做到实时持久化/秒级持久化。因为
bgsave
每次运行都要执行fork
操作创建子进程,属于重量级操作,如果不采用压缩算法(内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑),频繁执行成本过高(影响性能)。 - RDB文件使用特定二进制格式保存,Redis版本演进过程中有多个格式的RDB版本,存在老版本Redis服务无法兼容新版RDB格式的问题(版本不兼容)。
- 在一定间隔时间做一次备份,所以如果redis意外
down
掉的话,就会丢失最后一次快照后的所有修改(数据有丢失)。
网友评论