美文网首页MySQLMySQL程序员
一条SQL查询语句的执行过程

一条SQL查询语句的执行过程

作者: 张依一 | 来源:发表于2018-12-03 23:48 被阅读118次

    来源于极客时间《MySQL实战》 ,欢迎大家订阅学习

    最近刚刚购买了极客时间的课程《MySQL实战45讲》,我会在这里将学习到的知识点做一个总结。

    本节主要是讲MySQL的基础架构。比如执行以下语句时:

    mysql> select * from T where ID=10;
    

    这条语句在MySQL内部是如何处理的。

    基础架构图

    结构图
    如图 主体分为两部分:Server和存储引擎部分。

    Server包括:连接器、缓存查询、分析器、优化器、执行器。存储过程、触发器、视图等功能都在Server层处理。

    存储引擎负责数据的存储和提取。常见的有InnoDB、MyISAM。

    连接器

    连接器与客户端建立连接、获取权限、维持和管理连接。

    常见的命令:

    mysql -uroot -ppassword

    用来和服务器建立连接,TCP握手后完成认证过程。

    • 账号密码不对,报错:"Access denied for user"
    • 认证通过,在权限表中查询拥有的权限

    只有在连接过程才会从权限表中读取权限信息,中途对权限的修改不会影响已经建立的连接,只有重新登陆后才会使用新的权限信息。

    建立连接后如果长时间处于空闲状态,"show processlist" 命令可以看到到处于sleep状态的连接。
    若规定时间内无活动,则会自动断开连接。规定时间wait_timeout控制,默认为8小时。断开后,再次发请回会提示 "Lost connection to MySQL server during query" ,只能重新连接。

    防止数据库中出现占用大量内存的情况,可以用一下方法解决:

    1. 定期断开长连接或者占用内存过大的连接。
    2. MySQL5.7及以上版本,每次执行一个较大的操作,可执行 "mysql_reset_connection"命令来初始化连接资源,该操作不会重连和重新获取授权,只是恢复到刚建立连接的状态。

    查询缓存

    建立连接后,就可以执行select操作,这是会执行第二部分:查询缓存。

    一个请求进来,首先查询缓存,是否存在该记录。之前执行过的语句,则会以语句为key,执行后的结果集为value存储在内存中。

    • 如果在缓存中查找到,则回直接返回给客户端。
    • 如果没有找到记录,继续执行后面的操作,并将该语句与结果分别以key-value存入内存。

    不建议使用查询缓存,此操作弊大于利 ( MySQL8.0后将会删除该功能 )

    对于一个表,只要有更新便会将涉及到该表的缓存全部清空。
    只适用于不常更新的静态表
    推荐:
    -将query_cache_type 设置为 DEMAND,默认SQL不使用查询缓存,针对需要查询缓存的语句,使用SQL_cache显示指定,例如:

    select SQL_CACHE * from T where ID = 10;
    

    分析器

    这条SQL要做什么

    1. 词法分析
      识别SQL关键字,提出主要成分。MySQL根据"select"得出这是一条查询语句,根据"from T"识别表T,将"ID"识别为列名。
    2. 语法分析
      根据语法规则判断是否符合SQL的语法。如果出现错误,则提示:"You have an error in your SQL syntax...",后面是错误的地方,需要你关注"use naer"后的内容。

    优化器

    这条SQL如何做

    这个步骤将会选取最优的执行方式,例如:

    1. 当涉及到多个索引时,决定用哪个索引
    2. 多表关联时,决定连接顺序
      select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
      
      该步骤决定了先从t1表中取出c=10的ID值还是先查找出t2表中d=20的ID值。

    执行器

    真正的执行步骤

    根据连接器取到的权限判断,是否对表T有权限。

    • 若有权限,打开表继续操作。

    打开表后,根据表的引擎定义,使用引擎提供的接口。
    例:

    • 表T中ID字段无索引:

      • 调用InnoDB提供的接口,取出第一行,当ID=10时,将该行数据放入结果集。若不符合则字啊次调用引擎接口获取下一行,再次判断,直至最后一行数据。
      • 将结果集存入缓存、返回给客户端。
    • 表T中ID字段有索引:

      • 调用InnoDB的"获取满足条件的第一行"接口,server层还会再判断一次值是否正确,然后放入结果集,接着继续访问"满足条件的下一行"接口,这些接口是引擎已经定义好的。

    在MySQL的慢查询日志中,rows_examined字段表示该语句执行过程中扫描了多少行,这个值就是调用引擎获取数据行的时候添加的。

    某些场景下,执行器调用一次,引擎内部会扫描很多行,因此引擎扫描行数跟rows_examined并不完全相同,这一点后文会详细说明。


    评论区知识点:

    • 问题:如果查询语句中的字段不存在,会在哪个阶段报错?

      • 答案:会在分析器阶段报错。
      • 《高性能MySQL》提到解析器和预处理器
        解析器:处理语法和解析查询,生成一颗对应的解析树。
        预处理器:进一步检查解析树的合法性,比如:数据表和数据列是否存在,别名是否有歧义等。如果通过则生成新的解析树,在提交给优化器。
    • Connect_timeout 指的是“连接过程中”的等待时间

    • wait_timeout指的是“连接完成后,使用过程中”的等待时间

    感谢《MySQL实践》提供的图与知识点
    为丁奇大佬宣传一下

    image
    第二节:MySQL系列之一条更新SQL的生命历程

    相关文章

      网友评论

        本文标题:一条SQL查询语句的执行过程

        本文链接:https://www.haomeiwen.com/subject/kvdpcqtx.html