美文网首页
2 - 日志系统 - 一条更新语句是如何执行的

2 - 日志系统 - 一条更新语句是如何执行的

作者: 天命_风流 | 来源:发表于2020-05-11 16:09 被阅读0次

    关键字

    日志、备份和恢复、两阶段提交、原子性

    日志系统

    在之前一节中,我们介绍了 MySQL 的查询操作,以及它的执行过程。今天我们看一看对于数据库的更新来说,MySQL 做了哪些额外操作。

    对于更新来说,依然要经历之前所说的各个过程,在这里就不再赘述。而不同之处,是它使用了 MySQL 的日志系统。这个系统包括两个重要部分:redo log(重做日志)和 binlog(归档日志)

    redo log 日志

    在数据库中,数据的更新是非常频繁的,如果数据每更新一次,就将磁盘中的数据更行,这是非常不便的,尤其是,当写入的数据是零散分布在数据库中的时候。redo log 就是为了应对这样的场景的:redo log 可以将更新数据顺序地先写入一块磁盘中,注意,它的写入方式是顺序的。这样,就可以加快数据更新了,当然,在需要的时候,我们也要将这些数据重新写入磁盘的数据页中。
    redo log的要点如下:

    • redo log 不在内存中,而是在磁盘中。但是它利用了磁盘的顺序读写,因此依然可以大大提升性能。
    • 当有一条记录需要更新,InnoDB 引擎会先将记录写到 redo log 里,并更新内存。此时这条更新语句就完成了。
    • 在适当的时候, InnoDB 会将 redo log 刷新到磁盘的数据页里面。
    • InnoDB 的 redo log 是固定大小的,其构造为一个循环队列: 2-redo_log.png
    • 具体的擦写过程和循环消息队列的过程类似,在这里就不具体说了。
    • 有了 redo log,InnoDB 可以保证数据库即使异常重启,之前提交的记录都不会丢失。也就是 crash-safe

    binlog 日志

    之前说过,MySQL 整体有两块:Server层 和 引擎层。而刚才说的 redo log 日志是在引擎层的特有日志,在 server层 中则使用 binlog(归档日志)。

    redo log 和 binlog 有三点不同:

    • redo log 是 InnoDB引擎 特有的;binlog 是 MySQL 的 Server层 实现的。
    • redo log 是物理日志,记录的是 “在某个数据页上做了什么修改”;binlog 是逻辑日志,记录的是这个语句的原始逻辑,例如 SQL语句 中的逻辑。
    • redo log 是循环写的,空间会用完;binlog 是可以追加写入的。

    有了上面的理解,我们看一下执行器 和 InnoDB引擎 在执行一个 update语句 时的内部流程:

    mysql> update T set c=c+1 where ID=2;
    

    1.执行器先找引擎取 ID=2 这一行。ID 是主键,引擎直接用树搜索找到这一行。如果 ID=2 这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。
    2.执行器拿到引擎给的行数据,把这个值加上 1,比如原来是 N,现在就是 N+1,得到新的一行数据,再调用引擎接口写入这行新数据。
    3.引擎将这行新数据更新到内存中,同时将这个更新操作记录到 redo log 里面,此时 redo log 处于 prepare 状态。然后告知执行器执行完成了,随时可以提交事务。
    4.执行器生成这个操作的 binlog,并把 binlog 写入磁盘。
    5.执行器调用引擎的提交事务接口,引擎把刚刚写入的 redo log 改成提交(commit)状态,更新完成。

    其流程图如下: 深色代表执行器,浅色代表InnoDB

    你可能注意到了,最后三步是一个 “两阶段提交” 的过程,这个过程看起来很繁琐,但是它可以保证数据库的状态和用它的日志恢复出来的库的状态一致。要了解这句话,你需要了解一下数据库回复的过程:

    • 当需要数据库恢复到指定的某一秒时,比如中午的十二点,你可以这么做:
    • 首先,找到最近一次的全量备份。
    • 然后,从备份的时间点开始,将备份的 binlog 依次取出,重放到恢复十二点之前的那个时刻。
    • 这样,你的临时库就跟误删之前的线上库一样了,你可以把表数据从临时库取出,按需恢复线上库。

    了解了上面的过程,你可以想象一下,如果不使用“两阶段提交”,会产生怎样的数据“不一致”。
    其实不仅是数据恢复,当你想要多搭建几个读数据库增加读能力的时候,“不一致”的数据也会导致你的线上出现主从数据库不一致的情况。

    总结

    引用作者的总结:
    redo log 用于保证 crash-safe 能力。innodb_flush_log_at_trx_commit 这个参数设置成 1 的时候,表示每次事务的 redo log 都直接持久化到磁盘。这个参数我建议你设置成 1,这样可以保证 MySQL 异常重启之后数据不丢失。
    sync_binlog 这个参数设置成 1 的时候,表示每次事务的 binlog 都持久化到磁盘。这个参数我也建议你设置成 1,这样可以保证 MySQL 异常重启之后 binlog 不丢失。
    我还跟你介绍了与 MySQL 日志系统密切相关的“两阶段提交”。两阶段提交是跨系统维持数据逻辑一致性时常用的一个方案,即使你不做数据库内核开发,日常开发中也有可能会用到。

    思考题:
    前面我说到定期全量备份的周期“取决于系统重要性,有的是一天一备,有的是一周一备”。那么在什么场景下,一天一备会比一周一备更有优势呢?或者说,它影响了这个数据库系统的哪个指标?
    答案:
    好处是“最长恢复时间”更短。
    在一天一备的模式里,最坏情况下需要应用一天的 binlog。比如,你每天 0 点做一次全量备份,而要恢复出一个到昨天晚上 23 点的备份。一周一备最坏情况就要应用一周的 binlog 了。
    当然这个是有成本的,因为更频繁全量备份需要消耗更多存储空间,所以这个 RTO 是成本换来的,就需要你根据业务重要性来评估了。


    以上就是关于日志系统的内容

    注:本文章的主要内容来自我对极客时间app的《MySQL实战45讲》专栏的总结,我使用了大量的原文、代码和截图,如果想要了解具体内容,可以前往极客时间

    相关文章

      网友评论

          本文标题:2 - 日志系统 - 一条更新语句是如何执行的

          本文链接:https://www.haomeiwen.com/subject/fnuunhtx.html