Redis源码剖析之AOF

作者: xindoo | 来源:发表于2021-04-05 22:39 被阅读0次

Redis源码剖析之AOF
Redis 源码简洁剖析 15 - AOF
Redis源码分析--AOF文件增量追写源码阅读
Redis源码分析--AOF文件全量重写源码阅读
Redis切换为AOF不丢数据的正确步骤
Redis源码剖析之RDB
进阶的Redis之哈希分片原理与集群实战
Redis 的设计原理
Redis源码研究之AOF持久化
Netty之八核心源码剖析

书接上回，上回我们详细讲解了Redis的RDB机制，RDB解决了redis数据持久化一部分的问题，为什么说一部分？因为rdb是redis中某一时刻的快照，那么在这次快照后如果数据有新的变更，它是不会被持久化下来的，必须得等到下次rdb备份。然而，生成rdb是和消耗性能的，所以它就不适合很频繁生成。Redis为了弥补这一不足提供了AOF。

AOF的全称是AppendOnlyFile，源码在aof.c。其实关键就是Append(追加)，核心原理很简单，就是如果执行完命令(set,del,expire……)后，发现有数据变动，就将这次操作作为一条日志记录到aof文件里，如果有宕机就重新加载aof文件，重放所有的改动命令就可以恢复数据了。只要日志被完整刷到了磁盘上，数据就不会丢失。

配置

AOF的配置比较简单，只有如下几项。

appendonly no  # aof开关，默认关闭
appendfilename "appendonly.aof"  # 保存的文件名，默认appendonly.aof
# 有三种刷数据的策略
appendfsync always  # always是只要有数据改动，就把数据刷到磁盘里，最安全但性能也最差
appendfsync everysec  # 每隔一秒钟刷一次数据，数据安全性和性能折中，这也是redis默认和推荐的配置。 
appendfsync no # 不主动刷，什么时候数据刷到磁盘里取决于操作系统，在大多数Linux系统中每30秒提交一次，性能最好，但数据安全性最差。

源码

AOF的触发

aof如何实现，又是怎么被触发的，让我们详细看下源码。
server.c中的void call(client *c, int flags)是redis接受到client请求后处理请求的入口，其中会检测Redis中的数据有没有发生变化。如果有变化就会执行propagate()函数。

    dirty = server.dirty;
    prev_err_count = server.stat_total_error_replies;
    updateCachedTime(0);
    elapsedStart(&call_timer);
    c->cmd->proc(c); // 执行命令
    const long duration = elapsedUs(call_timer);
    c->duration = duration;
    dirty = server.dirty-dirty;
    if (dirty < 0) dirty = 0;

void propagate(struct redisCommand *cmd, int dbid, robj **argv, int argc,
               int flags)
{
    if (server.in_exec && !server.propagate_in_transaction)
        execCommandPropagateMulti(dbid);

    /* This needs to be unreachable since the dataset should be fixed during 
     * client pause, otherwise data may be lossed during a failover. */
    serverAssert(!(areClientsPaused() && !server.client_pause_in_transaction));

    if (server.aof_state != AOF_OFF && flags & PROPAGATE_AOF)
        feedAppendOnlyFile(cmd,dbid,argv,argc); // 如果aof开启了，就会向aof传播该命令。
    if (flags & PROPAGATE_REPL)
        replicationFeedSlaves(server.slaves,dbid,argv,argc);
}

propagate函数的作用就是将带来数据改动的命令传播给slave和AOF，这里我们只关注AOF，我们来详细看下feedAppendOnlyFile()函数。

AOF数据生成

void feedAppendOnlyFile(struct redisCommand *cmd, int dictid, robj **argv, int argc) {
    sds buf = sdsempty();
    /* The DB this command was targeting is not the same as the last command
     * we appended. To issue a SELECT command is needed. */
    if (dictid != server.aof_selected_db) {
        char seldb[64];

        snprintf(seldb,sizeof(seldb),"%d",dictid);
        buf = sdscatprintf(buf,"*2\r\n$6\r\nSELECT\r\n$%lu\r\n%s\r\n",
            (unsigned long)strlen(seldb),seldb);
        server.aof_selected_db = dictid;
    }

    if (cmd->proc == expireCommand || cmd->proc == pexpireCommand ||
        cmd->proc == expireatCommand) {
        /* 把 EXPIRE/PEXPIRE/EXPIREAT 命令转化为 PEXPIREAT 命令*/
        buf = catAppendOnlyExpireAtCommand(buf,cmd,argv[1],argv[2]);
    } else if (cmd->proc == setCommand && argc > 3) {
        robj *pxarg = NULL;
        /* When SET is used with EX/PX argument setGenericCommand propagates them with PX millisecond argument.
         * So since the command arguments are re-written there, we can rely here on the index of PX being 3. */
        if (!strcasecmp(argv[3]->ptr, "px")) {
            pxarg = argv[4];
        }
        /* 把set命令的expired所带的相对时间转化为绝对时间(ms). */
        if (pxarg) {
            robj *millisecond = getDecodedObject(pxarg);
            long long when = strtoll(millisecond->ptr,NULL,10);
            when += mstime();

            decrRefCount(millisecond);

            robj *newargs[5];
            newargs[0] = argv[0];
            newargs[1] = argv[1];
            newargs[2] = argv[2];
            newargs[3] = shared.pxat;
            newargs[4] = createStringObjectFromLongLong(when);
            buf = catAppendOnlyGenericCommand(buf,5,newargs);
            decrRefCount(newargs[4]);
        } else {
            buf = catAppendOnlyGenericCommand(buf,argc,argv);
        }
    } else {
        /* 其他的命令都不需要转化 */
        buf = catAppendOnlyGenericCommand(buf,argc,argv);
    }

    /* 追加到AOF缓冲区。在重新进入事件循环之前，数据将被刷新到磁盘上，因此在客户端在执行前就会得到回复。*/
    if (server.aof_state == AOF_ON)
        server.aof_buf = sdscatlen(server.aof_buf,buf,sdslen(buf));

    /* 如果后台正在进行AOF重写，我们希望将子数据库和当前数据库之间的差异累积到缓冲区中，
     * 以便在子进程执行其工作时，我们可以将这些差异追加到新的只追加文件中。 */
    if (server.child_type == CHILD_TYPE_AOF)
        aofRewriteBufferAppend((unsigned char*)buf,sdslen(buf));

    sdsfree(buf);
}

这里没有啥太复杂的逻辑，就是将命令转化为RESP协议格式的字符串(RESP协议后续会详解)，然后追加到server.aof_buf中，这时候AOF数据还都在缓冲区中，并没有写入到磁盘中，那buf中的数据何时写入磁盘呢？

刷数据

刷数据的核心代码在flushAppendOnlyFile()中，flushAppendOnlyFile在serverCron、beforeSleep和prepareForShutdown中都有被调用，它的作用就是将缓冲区的数据写到磁盘中，代码比较长且复杂，但大部分都是异常处理和性能监控，忽略掉这部分后代码也比较容易理解，这里就不再罗列了，详见aof.c。

RDB vs AOF

最后，我们来对比下RDB和AOF，他们各自都有啥优缺点，该如何选用。

RDB的优势

RDB是压缩的后紧凑数据格式，比较很适合备份，
同样的数据量下，rdb的文件大小会很小，比较适合传输和数据恢复。
RDB对Redis的读写性能影响小，生成RDB的时redis主进程会fork出一个子进程，不会影响到主进程的读写。
RDB数据加载更快，恢复起来更快。

RDB的缺点

RDB是定期备份，如果备份前发生宕机，数据可能会丢失。
RDB的生成依赖于linux的fork，如果数据量比较大的话，很影响服务器性能。

AOF的优势

AOF是持续性备份，可以尽可能保证数据不丢失。
Redis太大时，Redis可以在后台自动重写AOF。重写是完全安全的，因为Redis继续追加到旧文件时，会生成一个全新的文件，其中包含创建当前数据集所需的最少操作集，一旦准备好第二个文件，Redis会切换这两个文件并开始追加到新的那一个。
AOF文件格式简单，易于解析。

AOF的缺点

对于同一数据集，AOF文件大小通常大于等效的RDB文件。
如果使用fsync策略，AOF可能比RDB慢。

RDB和AOF该如何选

如果是要求极致的性能，但对数据恢复不敏感，二者可以都不要，如果是关注性能且关注数据可用性，但不要求数据完整性，可以选用RDB。如果说非常关注数据完整性和宕机恢复的能力，可以RDB+AOF同时开启。

参考资料

本文是Redis源码剖析系列博文，同时也有与之对应的Redis中文注释版，有想深入学习Redis的同学，欢迎star和关注。
Redis中文注解版仓库：https://github.com/xindoo/Redis
Redis源码剖析专栏：https://zxs.io/s/1h
如果觉得本文对你有用，欢迎一键三连。
本文来自https://blog.csdn.net/xindoo

Redis源码剖析之AOF
书接上回，上回我们详细讲解了Redis的RDB[https://blog.csdn.net/xindoo/arti...
Redis 源码简洁剖析 15 - AOF
AOF 是什么[#aof-%E6%98%AF%E4%BB%80%E4%B9%88] AOF 持久化的实现[#aof...
Redis源码分析--AOF文件增量追写源码阅读
重要说明，在看这篇文章之前，最好先通过剖析Redis协议了解Redis协议，AOF文件增量追写就是根据Redi...
Redis源码分析--AOF文件全量重写源码阅读
重要说明，在看这篇文章之前，最好先通过剖析Redis协议了解Redis协议，AOF文件全量重写就是根据Redi...
Redis切换为AOF不丢数据的正确步骤
因为AOF丢失数据的概率更低，因此如果对Redis中数据的完整性要求高的话，通常会启用AOF。但是由于启用AOF之...
Redis源码剖析之RDB
我们小学三年级的时候就知道，redis是一个纯内存存储的中间件，那它宕机会怎么样？数据会丢失吗？答案是可以不丢。 ...
进阶的Redis之哈希分片原理与集群实战
前面介绍了《进阶的Redis之数据持久化RDB与AOF》和《进阶的Redis之Sentinel原理及实战》，这次来...
Redis 的设计原理
Redis 持久化之RDB和AOFRedis 有两种持久化方案，RDB （Redis DataBase）和 AOF...
Redis源码研究之AOF持久化
本文主要研究AOF持久化策略的实现方式，了解AOF数据组织方式和运作机制。。建议阅读： 1、Redis AOF...
Netty之八核心源码剖析
个人专题目录 1. Netty之核心源码剖析 1.1 Netty 启动过程源码剖析源码需要剖析到Netty 调用...

Redis源码剖析之AOF

配置

源码

AOF的触发

AOF数据生成

刷数据

RDB vs AOF

RDB的优势

RDB的缺点

AOF的优势

AOF的缺点

RDB和AOF该如何选

参考资料

相关文章

Redis源码剖析之AOF

Redis 源码简洁剖析 15 - AOF

Redis源码分析--AOF文件增量追写源码阅读

Redis源码分析--AOF文件全量重写源码阅读

Redis切换为AOF不丢数据的正确步骤

Redis源码剖析之RDB

进阶的Redis之哈希分片原理与集群实战

Redis 的设计原理

Redis源码研究之AOF持久化

Netty之八核心源码剖析

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读