一、两类索引
大家知道,MySQL 中的索引有很多种不同的分类方式,可以按照数据结构分,可以按照逻辑角度分,也可以按照物理存储分,其中,按照物理存储方式,可以分为聚簇索引和非聚簇索引。
我们日常所说的主键索引,其实就是聚簇索引(Clustered Index);主键索引之外,其他的都称之为非主键索引,非主键索引也被称为二级索引(Secondary Index),或者叫作辅助索引。
对于主键索引和非主键索引,使用的数据结构都是 B+Tree,唯一的区别在于叶子结点中存储的内容不同:
- 主键索引的叶子结点存储的是一行完整的数据。
- 非主键索引的叶子结点存储的则是主键值。
这就是两者最大的区别。
所以,当我们需要查询的时候:
1、如果是通过主键索引来查询数据,例如 select * from user where id=100
,那么此时只需要搜索主键索引的 B+Tree 就可以找到数据。
2、如果是通过非主键索引来查询数据,例如select * from user where username='javaboy'
,那么此时需要先搜索 username 这一列索引的 B+Tree,搜索完成后得到主键的值,然后再去搜索主键索引的 B+Tree,就可以获取到一行完整的数据。
对于第二种查询方式而言,一共搜索了两棵 B+Tree,第一次搜索 B+Tree 拿到主键值后再去搜索主键索引的 B+Tree,这个过程就是所谓的回表。
从上面的分析中我们也能看出,通过非主键索引查询要扫描两棵 B+Tree,而通过主键索引查询只需要扫描一棵 B+Tree,所以如果条件允许,还是建议在查询中优先选择通过主键索引进行搜索。
二、一定会回表吗
那么不用主键索引就一定需要回表吗?答案是不一定。如果查询的列本身就存在于索引中,那么即使使用二级索引,一样也是不需要回表的。
举个例子,有一张user表,uname 和 address 字段组成了一个复合索引,那么此时,虽然这是一个二级索引,但是索引树的叶子节点中除了保存主键值,也保存了 uname 和address 的值。当我们查询explain select uname,address from user where username='javaboy
时,可以看到,此时使用到了 uname 索引,但是最后的 Extra 的值为 Using index,这就表示用到了索引覆盖扫描(覆盖索引),此时直接从索引中过滤不需要的记录并返回命中的结果,这一步是在 MySQL 服务器层完成的,并且不需要回表。
因此SQL优化中有一条优化建议就是避免使用select *
,其中有一个原因就是利用覆盖索引。
网友评论