美文网首页Android技术知识Android开发
好文推荐:详解, Redis 持久化,RDB模式AOF模式工作原

好文推荐:详解, Redis 持久化,RDB模式AOF模式工作原

作者: jett老师 | 来源:发表于2020-11-18 22:09 被阅读0次

    好文推荐
    原文链接:https://blog.51cto.com/13887323/2543914
    原文作者: Best_LXY

    redis 持久化

    Redis 虽然是一个内存级别的缓存程序,也就是redis 是使用内存进行数据的缓存的,但是其可以将内存的数据按照一定的策略保存到硬盘上,从而实现数据持久保存的目的
    目前redis支持两种不同方式的数据持久化保存机制,分别是RDB和AOF

    • RDB可以看作为某一时刻Redis的快照,比较适合灾难恢复.可以看作快照,也可以理解为Mysql Dump
      • AOF则是写入操作的日志,可以当作MySQL Binlog 帮助理解

    RDB 模式

    RDB 模式工作原理

    RDB(Redis DataBase):基于时间的快照,其默认只保留当前最新的一次快照,特点是执行速度比较快,缺点是可能会丢失从上次快照到当前时间点之间未做快照的数据

    RDB bgsave 实现快照的具体过程:

    • Redis从master主进程先fork出一个子进程,使用写时复制机制,子进程将内存的数据保存为一个临时文件,比如:tmp-.rdb,当数据保存完成之后再将上一次保存的RDB文件替换掉,然后关闭子进程,这样可以保证每一次做RDB快照保存的数据都是完整的
    • 因为直接替换RDB文件的时候,可能会出现突然断电等问题,而导致RDB文件还没有保存完整就因为突然关机停止保存,而导致数据丢失的情况.后续可以手动将每次生成的RDB文件进行备份,这样可以最大化保存历史数据
    1. redis执行bgsave命令,Redis判断当前存在正在进行执行的子进程,如RDB/AOF子进程,存在bgsave命令直接返回
    2. fork出子进程,fork操作中Redis父进程会阻塞
    3. fork完成返回  59117:M 13 Apr 13:44:40.312 * Background saving started by pid 59180
    4. 子进程进程对内存数据生成快找文件
    5. 子进程告诉父进程处理完成


    实现RDB方式

    • save同步,会阻塞其他命令,不推荐使用
    • bgsave 异步后台执行,不影响其他的执行
    • 自动,指定规则,自动执行

    RDB的相关配置文件

    In the example below the behaviour will be to save:
     206 #   after 900 sec (15 min) if at least 1 key changed
     207 #   after 300 sec (5 min) if at least 10 keys changed
     208 #   after 60 sec if at least 10000 keys changed
    save 900 1   #在九百秒内有一个触发我就执行
    save 300 10
    save 60 10000
    dbfilename dump.rdb
    dir ./     #编泽编译安装,默认RDB文件存放在启动redis的工作目录,建议明确指定存入目录
    stop-writes-on-bgsave-error yes
    rdbcompression yes
    rdbchecksum yes
    

    RDB模式的优缺点

    RDB 模式优点

    • RDB比较适合全量备份模式保存了某个时间点的数据,可以通过脚本执行redis指令bgsave(非阻塞,后台执行)或者save(会阻塞写操作,推荐)命令自行定义时间点的备份,可以保留多个备份,当出现问题时候方便恢复到不同时间节点,很适合备份,并且此文件格式支持不少第三方工具可以进行后续的数据分析
      比如:可以在最近24小时内,没小时进行一次备份RDB文件,并且在每个月的每一天,也备份一个RDB文件,这样的话,即便遇上问题,也可以随时将数据集还原到不同的版本
    • RDB可以最大化Redis的性能,父进程在保存RDB文件时候,唯一要做的就是fork出一个子进程,然后这个子进程就会处理接下来所有保存的工作,父进程无须执行任何磁盘i/o操作
    • REB在大量数据,比如几个G的数据,恢复速度比AOF的快

    RDB的缺点

    • REB方式不能实时保存数据,可能会丢失自上一次执行RDB备份到当前的内存数据
      如果你需要尽量避免在服务器故障时丢失数据,那么RDB不适合你。虽然Redis允许你设置不同的保存点(save point)来控制保存RDB文件的频率,但是,因为ROB文件需要保存整个数据集的状态,所以它并不是一个轻松的操作。因此你可能会至少5分钟才保存一次RDB文件。在这种情况下,一旦发生故障停机,你就可能会丢失好几分钟的数据。
    • 版本兼容RDB格式问题当数据量非常大的时候,从父进程fork子进程进行保存至RDB文件时需要一点时间,可能是毫秒或者秒,取决于磁盘IO性能在数据集比较庞大时,fork()可能会非常耗时,造成服务器在一定时间内停止处理客户端﹔如果数据集非常巨大,并且CPU时间非常紧张的话,那么这种停止时间甚至可能会长达整整一秒或更久。虽然 AOF重写也需要进行fork(),但无论AOF重写的执行间隔有多长,数据的持久性都不会有任何损失

    实践手动备份RDB文件的脚本

    [root@centos7 ~]#vim /apps/redis/etc/redis.conf
    save ""
    dbfilename dump_6379.rdb
    dir "/data/redis"
    appendonly no
    
    [root@centos8 ~]#cat redis_backup_rdb.sh
    #!/bin/bash
    . /etc/init.d/functions
    BACKUP=/backup/redis-rdb
    DIR=/data/redis
    FILE=dump_6379.rdb
    PASS=123456
    redis-cli -h 127.0.0.1 -a $PASS --no-auth-warning bgsave
    result=`redis-cli -a 123456 --no-auth-warning info Persistence |grep
    rdb_bgsave_in_progress| sed -rn 's/.*:([0-9]+).*/\1/p'`
    until [ $result -eq 0 ] ;do
      sleep 1
      result=`redis-cli -a 123456 --no-auth-warning info Persistence |grep
    rdb_bgsave_in_progress| sed -rn 's/.*:([0-9]+).*/\1/p'`
    done
    DATE=`date +%F_%H-%M-%S`
    [ -e $BACKUP ] || { mkdir -p $BACKUP ; chown -R redis.redis $BACKUP; }
    mv $DIR/$FILE $BACKUP/dump_6379-${DATE}.rdb
    action "Backup redis RDB"
    #执行
    [root@centos8 ~]#bash redis_backup_rdb.sh
    Background saving started
    Backup redis RDB                      [ OK ]
    [root@centos8 ~]#ll /backup/redis-rdb/ -h
    total 143M
    -rw-r--r-- 1 redis redis 143M Oct 21 11:08 dump_6379-2020-10-21_11-08-47.rdb
    

    范例:观察save 和 bgsave的执行过程67255

    #阻塞
    #生成临时文件
    

    范例: 自动保存

    [root@centos7 ~]#vim /apps/redis/etc/redis.conf
    save 60 3
    #测试60s内修改3个key,验证是否生成RDB文件
    

    AOF 模式

    AOF模式的工作模式(俩张图方便大家理解)


    详解, Redis 持久化,RDB模式AOF模式工作原理详解及操作
    1. 所有的写入命令追加到aof缓冲区
    2. AOF缓冲区根据对应appendfsync配置向硬盘做同步操作
    3. 定期对AOF文件进行重写
    4. Redis重启时,可以加载AOF文件进行数据恢复

    AOF:AppendOnylFile,按照操作顺序依次将操作追加到指定的日志文件末尾
    AOF 和 RDB 一样使用了写时复制机制,AOF默认为每秒钟 fsync一次,即将执行的命令保存到AOF文件当中,这样即使redis服务器发生故障的话最多只丢失1秒钟之内的数据,也可以设置不同的fsync策略always,即设置每次执行命令的时候执行fsync,fsync会在后台执行线程,所以主线程可以继续处理用户的正常请求而不受到写入AOF文件的I/O影响
    同时启用RDB和AOF,进行恢复时,默认AOF文件优先级高于RDB文件,即会使用AOF文件进行恢复
    注意!!!: AOF 模式默认是关闭的,第一次开启AOF后,并重启服务生效后,会因为AOF的优先级高于RDB,而AOF默认没有文件存在,从而导致所有数据丢失

    AOF rewrite 重写

    • 将一些重复的,可以合并的,过期的数据重新写入一个新的AOF文件,从而节约AOF备份占用的硬盘空间,也能加速恢复过程
    • 可以手动执行bgrewriteaof 触发AOF,或定义自动rewrite 策略


    注意!!!: AOF 模式默认是关闭的,第一次开启AOF后,并重启服务生效后,会因为AOF的优先级高于RDB,而AOF默认没有文件存在,从而导致所有数据丢失

    [root@centos8 ~]#ll /var/lib/redis/
    total 314392
    -rw-r--r-- 1 redis redis 187779391 Oct 17 14:23 dump.rdb
    [root@centos8 ~]#redis-cli
    127.0.0.1:6379> config get appendonly
    1) "appendonly"
    2) "no"
    127.0.0.1:6379> config set appendonly  yes
    OK
    [root@centos8 ~]#ll /var/lib/redis/
    total 314392
    -rw-r--r-- 1 redis redis 187779391 Oct 17 14:23 dump.rdb
    -rw-r--r-- 1 redis redis  85196805 Oct 17 14:45 temp-rewriteaof-2146.aof
    [root@centos8 ~]#ll /var/lib/redis/
    total 366760
    -rw-r--r-- 1 redis redis 187779391 Oct 17 14:45 appendonly.aof
    -rw-r--r-- 1 redis redis 187779391 Oct 17 14:23 dump.rdb
    [root@centos8 ~]#vim /etc/redis.conf
    appendonly yes #改为yes
    #config set appendonly yes 可以同时看到下面显示
    

    AOF 相关配置

    appendonly yes              #是否开启AOF日志记录,默认redis使用的是rdb方式持久化,这种方式在许多应用中已经足够用了,但是redis如果中途宕机,会导致可能有几分钟的数据丢失(取决于dump数据的间隔时间),根据save来策略进行持久化,Append Only File是另一种持久化方式,可以提供更好的持久化特性,Redis会把每次写入的数据在接收后都写入 appendonly.aof 文件,每次启动时Redis都会先把这个文件的数据读入内存里,先忽略RDB文件。默认不启用此功能
    appendfilename "appendonly-${port}.aof"          #文本文件AOF的文件名,存放在dir指令指定的目录中
    appendfsync everysec    #aof持久化策略的配置
    #no表示由操作系统保证数据同步到磁盘,Linux的默认fsync策略是30秒,最多会丢失30s的数据
    #always表示每次写入都执行fsync,以保证数据同步到磁盘,安全性高,性能较差
    #everysec表示每秒执行一次fsync,可能会导致丢失这1s数据,此为默认值,也生产建议值
    dir /path               #快照文件保存路径,示例:dir "/apps/redis/data"
    
    no-appendfsync-on-rewrite yes     #在aof rewrite期间,是否对aof新记录的append暂缓使用文件同步策略,主要考虑磁盘IO开支和请求阻塞时间。
    #默认为no,表示"不暂缓",新的aof记录仍然会被立即同步到磁盘,是最安全的方式,不会丢失数据,但是要忍受阻塞的问题
    #为yes,相当于将appendfsync设置为no,这说明并没有执行磁盘操作,只是写入了缓冲区,因此这样并不会造成阻塞(因为没有竞争磁盘),但是如果这个时候redis挂掉,就会丢失数据。丢失多少数据呢?Linux的默认fsync策略是30秒,最多会丢失30s的数据,但由于yes性能较好而且会避免出现阻塞因此比较推荐
    #rewrite 即对aof文件进行整理,将空闲空间回收,从而可以减少恢复数据时间
    auto-aof-rewrite-percentage 100             #当Aof log增长超过指定百分比例时,重写AOF文件,设置为0表示不自动重写Aof日志,重写是为了使aof体积保持最小,但是还可以确保保存最完整的数据
    auto-aof-rewrite-min-size 64mb              #触发aof rewrite的最小文件大小
    aof-load-truncated yes                      #是否加载由于某些原因导致的末尾异常的AOF文件(主进程被kill/断电等),建议yes
    aof-use-rdb-preamble no #redis4.0新增RDB-AOF混合持久化格式,在开启了这个功能之后,AOF重写产生的文件将同时包含RDB格式的内容和AOF格式的内容,其中RDB格式的内容用于记录已有的数据,而AOF格式的内容则用于记录最近发生了变化的数据,这样Redis就可以同时兼有RDB持久化和AOF持久化的优点(既能够快速地生成重写文件,也能够在出现问题时,快速地载入数据),默认为no,即不启用此功能
    

    范例: 动态修改配置自动生成appendonly.aof文件

    127.0.0.1:6379> CONFIG set appendonly yes
    

    手动执行AOF重写 BGREWRITEAOF 命令

    • BGREWRITEAOF
      时间复杂度: O(N), N 为要追加到 AOF 文件中的数据数量。
      执行一个 AOF文件 重写操作。重写会创建一个当前 AOF 文件的体积优化版本。
    • 即使 BGREWRITEAOF 执行失败,也不会有任何数据丢失,因为旧的 AOF 文件在 BGREWRITEAOF 成功之前不会被修改。
    • 重写操作只会在没有其他持久化工作在后台执行时被触发,也就是说:
      如果 Redis 的子进程正在执行快照的保存工作,那么 AOF 重写的操作会被预定(scheduled),等到保存工作完成之后再执行 AOF 重写。在这种情况下, BGREWRITEAOF 的返回值仍然是 OK ,但还会加上一条额外的信息,说明 BGREWRITEAOF 要等到保存操作完成之后才能执行。在 Redis 2.6 或以上的版本,可以使用 INFO [section] 命令查看 BGREWRITEAOF 是否被预定。
    • 如果已经有别的 AOF 文件重写在执行,那么 BGREWRITEAOF 返回一个错误,并且这个新的
      BGREWRITEAOF 请求也不会被预定到下次执行。
    • 从 Redis 2.4 开始, AOF 重写由 Redis 自行触发, BGREWRITEAOF 仅仅用于手动触发重写操作。

    范例: 手动bgrewriteaof

    127.0.0.1:6379> BGREWRITEAOF
    Background append only file rewriting started
    
    #同时可以观察到下面显示
    

    AOF 模式优缺点

    AOF 模式优点

    • 数据安全性相对较高,根据所使用的fsync策略(fsync是同步内存中redis所有已经修改的文件到存储设备),默认是appendfsync everysec,即每秒执行一次 fsync,在这种配置下,Redis 仍然可以保持良好的性能,并且就算发生故障停机,也最多只会丢失一秒钟的数据( fsync会在后台线程执行,所以主线程可以继续努力地处理命令请求)
    • 由于该机制对日志文件的写入操作采用的是append模式,因此在写入过程中不需要seek, 即使出现宕机现象,也不会破坏日志文件中已经存在的内容。然而如果本次操作只是写入了一半数据就出现了系统崩溃问题,不用担心,在Redis下一次启动之前,可以通过 redis-check-aof 工具来解决数据一致性的问题
    • Redis可以在 AOF文件体积变得过大时,自动地在后台对AOF进行重写,重写后的新AOF文件包含了恢复当前数据集所需的最小命令集合。整个重写操作是绝对安全的,因为Redis在创建新 AOF文件的过程中,append模式不断的将修改数据追加到现有的 AOF文件里面,即使重写过程中发停机,现有的 AOF文件也不会丢失。而一旦新AOF文件创建完毕,Redis就会从旧AOF文件切换到新AOF文件,并开始对新AOF文件进行追加操作。
    • AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上,也可以通过该文件完成数据的重建AOF文件有序地保存了对数据库执行的所有写入操作,这些写入操作以Redis协议的格式保存,因此 AOF文件的内容非常容易被人读懂,对文件进行分析(parse)也很轻松。导出(export)AOF文件也非常简单:
    • 举个例子,如果你不小心执行了FLUSHALL.命令,但只要AOF文件未被重写,那么只要停止服务器,移除 AOF文件末尾的FLUSHAL命令,并重启Redis ,就可以将数据集恢复到
      FLUSHALL执行之前的状态。

    AOF模式的缺点

    • 即使有些操作是重复的也会全部记录,AOF 的文件大小要大于 RDB 格式的文件
    • AOF 在恢复大数据集时的速度比 RDB 的恢复速度要慢
    • 根据fsync策略不同,AOF速度可能会慢于RDB
    • bug 出现的可能性更多

    RDB和AOF 的选择

    • 如果主要充当缓存功能,或者可以承受数分钟数据的丢失, 通常生产环境一般只需启用RDB可,此也是默认值
    • 如果数据需要持久保存,一点不能丢失,可以选择同时开启RDB和AOF,一般不建议只开启AOF

    相关文章

      网友评论

        本文标题:好文推荐:详解, Redis 持久化,RDB模式AOF模式工作原

        本文链接:https://www.haomeiwen.com/subject/heyhiktx.html