下面是mysql查询的路径
mysql查询执行路径
下面简单的理解一下mysql服务器的查询过程
查询缓存
在解析一个查询语句之前,如果查询缓存是打开的,那么mysql会优先检查这个查询是否命中缓存中的数据。如果命中查询缓存,则在检查用户权限后直接返回查询结果。否则进入下一阶段的处理。
解析器
mysql通过关键字将sql语句进行解析,并生成解析树。解析器使用mysql语法规则验证和解析查询。例如,它将验证是否使用错误的关键字,或者使用关键字的顺序是否正确等,还有引号能否前后匹配。
预处理器
预处理器则根据mysql规则进一步检查解析树是否合法,例如,这里将检查数据表和数据列是否存在,还会解析名字和别名,看是否有歧义等。下一步预处理还会验证权限。
查询优化器
一条查询可以有很多种执行方式,最后都返回相同的结果,优化器的作用就是找到这其中最好的执行计划。
mysql使用基于成本的优化器,他将尝试预测一个查询使用某种执行计划时的成本,并选择其中成本最小的一个。可以通过查询当前会话的last_query_cost的值来得知mysql计算当前的当前查询的成本。
mysql> select sql_no_cache count(*) from renren.applicants;
+----------+
| count(*) |
+----------+
| 499362 |
+----------+
1 row in set (0.97 sec)
mysql> show status like 'last_query_cost';
+-----------------+---------------+
| Variable_name | Value |
+-----------------+---------------+
| Last_query_cost | 125297.999000 |
+-----------------+---------------+
1 row in set (0.02 sec)
这个结果表示mysql的优化器认为大概需要做125297个数据页的随机查询才能完成上面的查询,这是根据一系列的统计信息计算的来的。 sql_no_cache代表不读取缓存。
下面是一些mysql能够处理的优化类型:
重新定义关联表的顺序
数据表的关联并不是总按照查询指定的顺序进行。
将外连接转换成内连接
并不是所有的outer join 语句都必须以外连接的方式执行。例如where条件、库表结构都可能会让外连接等价于一个内连接。mysql能够识别这点并重写查询,让其可以调整关联顺序。
使用等价变换规则
mysql可以使用等价变化来简化并规范表达式。它可以合并和减少一些比较,还可以移除恒成立和不成立的判断。例如,(5=5 and a>5) 被该写成 a>5,还有(a<b and b=c) and a=5 会该写成 b>5 and b=c and a=5。
覆盖索引扫描
当索引中的列包含所有查询中需要的列时,mysql就可以使用索引返回需要的数据,而无须查询对应的数据行。
子查询优化
mysql在某些情况下可以将子查询转换成一种效率更高的形式,从而减少多个子查询多次对数据的访问。
(未完)
等值传播
如果两个列的值通过等式关联,mysql能够把其中一列的where条件传递到另一列上,例如:
select film.film_id from film inner join film_actor using(film_id)
where film.film_id > 500;
因这里使用using等值关联,mysql知道where子句不仅适用于film,而且对于film_actor同样适用。
列表in()的比较
很多数据库中in()完全等同于多个or条件的子句,但在mysql中,将in()列表中的数据先进行排序,然后通过二分查找方式确定列表中的值是否满足条件,in列表中有大量取值时,mysql来说处理速度更快。(并不是指mysql 中in列表的值越多查询越快,是与其他数据库对比来说相同的in数据量,mysql速度会更快)
提前终止查询
在发现已经满足查询需求的时候,mysql总是能够立即终止查询。最典型的是使用limit子句。此外发现一个不成立条件,如..where film_id = -1
,这类查询在优化阶段就已终止。当存储引擎需要检索“不同取值”或者判断存在性的时候,mysql会用此类优化。类似这种“不同值/不存在”的优化一般可用于distinct、not exist() 或者 left join类型的查询。
优化count()、min()、max()
在B-tree索引中,找某列最小值,只需查询B-tree索引最左端记录,最大值查询B-tree最右端记录,优化器会将这个表达式作为一个常熟对待。在没有任何where条件的count(*)查询,在myisam引擎中可以直接读取已存储好的行数信息。
网友评论