1. InnoDB中用到的索引是B+树,回顾一下B+树的知识。
2. 聚集索引
每张InnoDB表都会有一个聚集索引用于指定行数据存放的顺序。默认情况下,InnoDB以表的主键作为聚集索引,即该表按照主键的大小顺序进行存储的。而聚集索引就是以主键构造的一颗B+树,且叶子节点就是行数据本身。
InnoDB聚集索引的选取:
如果表有主键则主键就是聚集索引,如果没有则选取第一个UNIQUE索引且索引对应的行是NOT NULL的,如果还没有,则系统自动生成。
1. 聚集索引的特点:
- 由于一张表的排列顺序只有一种,所以一张表也最多只能有一个聚集索引
- 我们创建表时,无法手动指定聚集索引的。
2. 聚集索引的优点
- 由于叶子节点存放的就是行数据本身,所以查找只需要一次遍历B+树就可以找到
- 对聚集索引字段的排序和范围查找很快
- 排序:因为聚集索引已经是排好序的,所以无需再进行排序操作。
- 范围:我们只需要找到范围的两端,且由于叶子节点是一个双向链表,且是数据本身,所以两端叶子之间的叶子节点就是结果。
3. 非聚集索引
除了聚集索引的索引都叫非聚集索引。
非聚集索引和聚集索引的区别就是叶子节点存放的数据。且非聚集索引显然一张表可以有多个的。
- 聚集索引叶子节点存放的是行数据本身。
- 非聚集索引叶子节点存放的是聚集索引的值。
所以对非聚集索引的查找[通常情况下]至少要经过两次B+树的遍历。且范围查找时,找到所有符合条件的聚集索引值之后,需要依次对每个聚集索引值找到对应的数据。
MyISAM引擎表不存在聚集索引,所有的索引的叶子节点存放的都是行数据的地址,即每次查找通过B+树找到数据的地址,然后再根据地址找到具体的数据。
4. 联合索引
如果有一个联合索引(a,b),则就会建一个这样的组合树,树的节点每个“值”都是一个数值对,而且按照a的大小顺序排的,当a相等时,才会根据b的大小排。如图。
联合索引
所以(a,b)索引时,可以单独查a也会走索引。而如果单独查b则不会走索引。
- 联合索引的第二个好处:
已经对第二个键做好了排序,比如:
select * from t where a = 5 order by b
其实order by b这步是不需要进行任何额外开销的,因为联合索引已经对b做好了排序了,所以直接取a = 5就可以了。
5. 覆盖索引
InnoDB是支持覆盖索引的,即从非聚集索引中就可以得到想要的结果,而不需进行回聚集索引查询。
这样的情况有两种:
1. 根据非聚集索引的条件查询聚集索引对应列的值
例如:加入a是聚集索引,b是非聚集索引
select a from t where b = 2;
我们知道非聚集索引叶子节点存的就是聚集索引的值,所以这个查询只需进行一次B+树搜索就可以了。
2. 某些统计问题
因为非聚集索引存的只是聚集索引的值,而聚集索引存的是整个行数据,所以非聚集索引的大小要远远小于聚集索引,小就意味着更少的IO。所以如果可以通过非聚集索引完成的事,就不要使用聚集索引。
例如:假设t有主键a,和非聚集索引b
select count(*) from t;
这条语句使用的就是b,因为b更小更高效。
覆盖索引有个特点:
- 使用explain进行执行过程分析时,extra字段是using index
- 一般情况下,联合索引(a,b),根据b的查询不会用到这个联合索引,但如果查询的是count就可能会用到。
select count(*) from t where b = 2;
用到这个索引的原因是因为非聚集索引很小,查询的效果快。
6. 索引提示
当InnoDB最终使用的index并不是最优的时(这种情况几乎不会出现),我们可以给它一些提示,建议它用某个索引。
select * from t user index(ix_a) where a = 1;
注意这里只是建议它使用,最终使用的索引还是由InnoDB自己决定。
对之对应的还有force index,即强制这条查询语句使用某个索引。
select * from t force index(ix_a) where a = 1;
网友评论