MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执

作者: 程序员网址导航 | 来源:发表于2019-08-16 20:10 被阅读0次

MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执
【重学MySQL60天】Day2 日志系统：一条SQL更新语句是
2019-08-11第二讲:日志系统[mysql实战45讲]
mysql实战之一条SQL更新语句是如何执行的？(待更新)
MySQL系统学习（01）：基础架构，一条SQL查询语句是如何执
mysql基础——sql 执行流程
mysql记录sql语句日志
2：一条SQL更新语句是如何执行的？
SQL——事务
MySQL 一条SQL语句实现批量更新数据

image.png

前言

在上一篇学习笔记MySQL系统学习（01）：基础架构，一条SQL查询语句是如何执行的我们系统的了解了一个查询的SQL语句的执行流程，并介绍了查询过程中涉及到的处理模块，一般查询语句的执行过程会包含：连接器、分析器、优化器、执行器等功能模块，最后到达存储引擎。

那么，一条更新语句的执行流程又是怎么的？跟查询语句有什么区别？

之前有看到过MySQL可以恢复到半个月内任一一秒的状态。如果你没有听过这句话，那你有了解过自己公司的MySQL数据同步方案吗？我以前的公司有两个机房，一般我们的真是操作只会发生在其中一个机房（具体发生在哪个机房，这个跟业务层的请求分发有关），双机房的数据同步有跨机房同步方案，仔细了解下到是容易理解，但是同机房内MySQL集群间数据是怎么做同步的？一直比较好奇。

我们还是从一张表的一条更新语句说起，下面有一个非常简单的创建语句，这个表有一个主键ID，和整形字段c:

mysql> create table T(
  `id` int(11) unsigned primary key,
  `c` int
);

如果要将 ID=2 这一行的值加 1，SQL 语句就会这么写：

mysql> update T set c = c+1 where id = 2;

上篇文章中有介绍过SQL语句的执行链路，这里再把这张图拿过来，我们可以先简单的看看这张图回顾下。首先，可以准确的说查询语句的那一套执行流程，更新语句也同样会执行一遍。

image.png

执行语句前第一步仍然是需要先建立数据库连接，这是连接器的工作。
上篇文章中提到过，一个表如果有更新操作的话，这张表的所有缓存都会失效，所以这条语句会将这张表上的所有缓存结果都清空。这也是一般不建议使用查询缓存的原因。

接下来，分析器会通过“词法分析”和“语法分析”解析知道这还是一条更新语句。

优化器决定要使用ID这个索引。

执行器负责具体执行，找到这一行，然后更新。

大体来看与查询流程几乎一样。但是不一样的是，更新流程还涉及到两个重要的日志模块。这也正式我今天学习的主要内容，redo log（重做日志）和 binlog（归档日志）。如果接触MySQL，那这两个词肯定是绕不开的。不过话说回来，redo log和binlog在设计上有很多有意思的地方，如果静下心去了解一下，这些可能也能应用到我们自己的程序中来。

重要日志模块：redo log

小时候家里开过“小卖部”，等同与今天的便利店。家里会有一个账本，村里人来买东西，有的人会赊账（在农村商店赊账很常见，因为都是左邻右舍，大家都很熟悉），专门用来记账用的。一开始赊账的人不多，就靠人脑记忆（听起来有点高端哈，就是记忆），但是当赊账的人多了，光靠记忆是记不住的，或则会记混乱，而且有的人是在我爸、我妈手上赊的账，有的人是在我手上赊的，信息做不到同步，容易丢、容易混。后面赊账的人变多了，这才有了账本这个东西。

如果有人赊账或者还账的话，我一般的做法有两种：

（1）一种做法是把账本拿出来，记上去或者划掉

（2）另一种做法是现在脑子里记着，等晚上了关门以后在把账本拿出来核算。

在生意红火的时候，我一般会选择后者（有人说我缺心眼！例子觉得有点不合适，体谅下，就当我是选择后者吧）。你想想下，那么多人买东西，我每个都直接翻账本的话，首先我要找到这个人赊账总额那条记录。密密麻麻十几页，找到还得在盘算，那其他排队的客人岂不是早都不耐烦了吗。效率太低，会影响生意。

同样，在MySQL里也有这个问题，如果每一次的更新操作的日志都需要写进磁盘，然后磁盘也要找到对应的那条记录，然后在更新，整个过程的IO成本、查找成本都是相当的高。为了解决这个问题，MySQL的设计者就利用我对待小卖部记账的第二种方式来解决这个问题。

而记忆力和账本配合的整个过程，其实就是MySQL里面经常说到的WAL技术，WAL全称是Write-Ahead Logging，它的关键点就是先写日志，在写磁盘（类似于我先记到脑子里，等到不忙的时候在一块更新到账本上）。

具体来说，当有一条记录需要更新的时候，InnoDB引擎会先把记录写到redo log里面，并更新内存，这个时候更新就算完成了。同时，InnoDB引擎会在适当的时候，将这个更新操作记录更新到磁盘里面，而这个更新往往是在系统比较空闲的时候做，就像晚上停业后我在将记忆里的账目更新到账本上一样。

如果今天赊账不多，我可以等晚上停业后在更新账本。但是如果今天赊账非常多的话，我可能一个上午脑子里面就乱了，记不住了怎么办？这个时候我会听下手中的活，先把更早的赊账记录同步到账目，只需要记住最近几笔赊账记录，晚点在更新。

于此类似，InnoDB的redo log的大小是固定的，比如可以配置为一组是4个文件，每个文件大小是1GB，那么这个redo log最多可以记录4GB的更新记录。从开头开始记录，一直记到末尾，记录满了，然后有循环重复继续记录（记录慢了还怎么记？忘记上面我们提到的记录不下的时候会放下手中的活，把最早的一部分账先同步到磁盘了吗）。

有了redo log，InnoDB就能保证及时数据库发生异常重启，之前提交的记录都不会丢失，这个能力成为crash-safe

重要日志模块binlog

上面MYSQL基础架构图里面提到了MySQL从整体来看，其实就只有两块：Server层，它主要负责MySQL功能层面的事情；存储引擎层，负责存储相关的具体事宜。上面我们提到redo log是存储引擎特有的日志，而server层也有自己的日志，称为binlog（归档日志）

是不是比较好奇会为什么会有两份日志，有这个必要吗？

因为最开始MySQL里面并没有InnoDB引擎。MySQL自带的引擎是MyISAM，但是MyISAM没有crash-safe的能力，binlog日志只能用于归档。其实InnoDB是由另外一个公司已插件的形式引入MySQL的，也是因为开始的MySQL没有crash-safe的能力，所以InnoDB才引入了redo log来实现这一能力。

这两个日志主要有3个不同点：
1.redo log是InnoDB引擎特有的；binlog是MySQL的Server层实现的，所有引擎都可以使用。

2.redo log是物理日志，记录的是“在某个数据页上做了什么修改”；binlog是逻辑日志，记录的是这个语句的原始逻辑，比如“给ID=2这一行的c字段加1”

3.redo log是循环写的，空间固定会用完；binlog可以追加写入（这里的追加写入指当binlog的日志文件写到一定程度，会自动切的下一个文件，不会直接覆盖）。

有了对两个log文件的概念性理解，我们再来看执行器和InnoDB引擎在执行这个简单的update语句时的内流程。

1.执行器先找引擎取ID=2这一行记录。ID是主键，引擎直接通过数搜索找到这一行。如果ID=2这一行数据本身就在内存中，就直接返回给执行器；否则需要先从磁盘读入内存，在返回。

2.执行器拿到引擎给的行数据，把c这个值加1，得到新的一行数据，然后在调用引擎接口，写入这行新数据。

3.引擎将这行新数据更新到内存中，同时将这个更新操作记录到redo log里面，此时redo log处于准备就绪（prepare）状态。然后告知执行器执行完成，随时可以提交事务。

4.执行器生产这个操作的binlog，并吧binlog写入磁盘。

5.执行器调用引擎的事务提交接口，引擎把刚刚的redo log改成提交（commit）状态，更新完成。

这里我又画了一个这个update语句的执行流程图，图中浅色框表示在InnoDB中执行的，深色框标识在执行器执行的。

image.png

看上面流程图，可能你会注意到最后3不有点绕，将redo log的写入拆分成了俩个步骤：prepare和commit，这就是“两阶段提交”

两阶段提交

为什么要有“两阶段提交”呢？这是为了让两份日志之间的逻辑一致。要说明这个问题，我们要从文章开头的那个问题说起：怎样让数据库回到半月内的任一一秒的状态？或者说同机房数据如何同步？

前面我提到了，binlog会记录所有的逻辑操作，并且是采用“追加写”的形式。如果你的DBA承诺半个月内的可以恢复，那么备份系统中一定会保留半个月内的所有binlog，同时系统会定期做整库备份。这里的定期取决于你的业务系统的重要性/或者说数据的重要性，可以一天一备份，也可以一周一备份。

当需要恢复到指定的某一秒时，比如某天下午两点发现上午10点有一次误删表的操作，需要找回数据你可以这么做（一般这个恢复的操作都是由DBA操作的，业务开发人员根本没有这个权限，但是可以了解下）

1.首先，找到最近一次的全量备份，如果你运气好，可能就是昨天晚上的一个备份，从这个备份恢复到临时库。

2.然后，从备份的时间点开始，将备份的binlog依次取出来，重放到上午误删表的那个时刻。

这样你的临时库就跟误删之前的线上库一样了，然后你可以把表数据从临时表中取出来，按需恢复到线上库去。

好了，说完了数据恢复过程，我们在回头来看为什么要有“两阶段提交”。这个可以反证法来解释一下：

由于redo log和bin log是两个独立的逻辑，如果不用“两阶段提交”，那么就要先写完redo log再写binlog，或者采用反过来的顺序。我们看看这两种会有什么问题？

1.先写redo log后写binlog。假设在redolog写完，binlog还没写的时候MYSQL进程异常重启。我们前面说过，redo log写完后，系统即使崩溃，仍然能够把数据恢复，所以恢复后的这一行c值为1。但是由于binlog还没有写完就崩溃了（crash），这时候binlog里面还没有这条语句。因此之后备份日志的时候，存起来的binlog里面就没有这条语句。然后我们会发现，如果需要用这个binlog来恢复临时库的话，由于这条语句的binlog丢失，这个临时库就会少了这一次更新，恢复出来的这一行c值就是0，与原库的值不同。

2.先写binlog后写redo log。如果在binlog写完之后crash，由于redo log还没写，崩溃恢复以后这个事务无效，所以这一行c值肯定是0.但是binlog里面已经记录“c值由0变成1”的这条记录。所以之后用binlog恢复出来的数据就多了一个事务出来，原值应该是0的。

可以看到，如果不使用“两阶段提交”，那么数据库的状态就有可能跟用它日志恢复出来的数据不一致，这样是有问题的。

可能会觉得这个概率是不是很低，平时也没有什么动不动恢复临时库的场景？

其实不是的，比如我一开是提到的第二个疑惑，同机房数据是怎么同步的，其实也是要依赖binlog的。包括MySQL集群在做扩容哦时候，需要数据的同步也是一样的道理。

简单说，redo log和binlog都可以用来表示事务的提交状态，而“两阶段提交”就是为了让这两个状态保持逻辑上的一致。

总结

这篇学习笔记中首先我简单的介绍了一条更新SQL的执行流程，与查询SQL类似，通过不一样的地方引出记录MySQL操作的两个非常重要的日志，即物理日志redo log和逻辑日志binlog。

redo log用于保证crash-safe能力。innodb_log_at_trx_commit这个参数的值设置为1的时候，表示每次事务的redo log都持久化到磁盘。这个参数我建议设置为1，因为这样可以MySQL异常重启后数据不丢失。

sync_binlog这个参数设置为1的时候，表示每次事务的binlog都持久化到磁盘，同理，这个我也建议设置为1.

最后介绍了为什么要有“两阶段提交”，他的作用是为了保证redo log和bin log的事务提交状态在逻辑上保持一致。

我的更多兴趣分享：[个人网站RelaxHeart网 - TEC博客](http://www.relaxheart.cn/to/master/blog

MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执
原文：MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执行的前言在上一篇学习笔记MySQL系统学...
【重学MySQL60天】Day2 日志系统：一条SQL更新语句是
学习内容 : MySQL日志系统与查询流程不一样的是，一条SQL更新语句的执行流程还涉及两个重要的日志模块：物理...
2019-08-11第二讲:日志系统[mysql实战45讲]
原文来自: 极客时间[mysql实战45讲] 第二讲: 日志系统: 一条SQL更新语句是如何执行的. 前言: se...
mysql实战之一条SQL更新语句是如何执行的？(待更新)
日志系统：一条SQL更新语句是如何执行的？ 1.update T set c=c+1 where ID=2;的执行...
MySQL系统学习（01）：基础架构，一条SQL查询语句是如何执
原文：MySQL系统学习（01）：基础架构，一条SQL查询语句是如何执行的前言学习技术，不应该直接陷进细节里，...
mysql基础——sql 执行流程
内容一条sql查询语句如何执行一条sql更新语句如何执行一 1条sql查询语句如何执行 1.1 执行流程例如...
mysql记录sql语句日志
设置mysql记录SQL语句日志文件
2：一条SQL更新语句是如何执行的？
2：一条SQL更新语句是如何执行的？ redolog（重做日志）：作为：酒店黑板账本角色中的黑板在酒店突然...
SQL——事务
事务（transaction）由查询和更新语句序列组成（何为序列，有序的列）。 SQL规定当一条SQL语句被执，就...
MySQL 一条SQL语句实现批量更新数据
MySQL 一条SQL语句实现批量更新数据(update结合case,when和then的使用案例) 这句sql的...

MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执

前言

重要日志模块：redo log

重要日志模块binlog

两阶段提交

总结

相关文章

MySQL系统学习（02）：日志模块，一条SQL更新语句是如何执

【重学MySQL60天】Day2 日志系统：一条SQL更新语句是

2019-08-11第二讲:日志系统[mysql实战45讲]

mysql实战之一条SQL更新语句是如何执行的？(待更新)

MySQL系统学习（01）：基础架构，一条SQL查询语句是如何执

mysql基础——sql 执行流程

mysql记录sql语句日志

2：一条SQL更新语句是如何执行的？

SQL——事务

MySQL 一条SQL语句实现批量更新数据

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读