1.1 索引
1.1 索引概述
-
介绍
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
5.jpg
-
演示
6.jpg
备注:上述的二叉树结构只是示意图,并非真正的索引结构。
-
优缺点
7.jpg
1.2 索引结构
MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的结构,主要包含以下几种:


我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。
-
二叉树
10.jpg
二叉树缺点:顺序插入时,会形成一个链表,查询性能大大降低。 大数据量情况下,层级较深,检索速度慢。
红黑树:大数据量情况下,层级较深,检索速度慢。 -
B-Tree(多路平衡查找树)
以一颗最大度数(max-degree)为5(5阶)的b-tree为例(每个节点最多存储4个key,5个指针,指针=key+1):
11.jpg
树的度数指的是一个节点的子节点个数。
具体动态变化的过程可以参考网站: https://www.cs.usfca.edu/~galles/visualization/BTree.html -
B+Tree
以一颗最大度数(max-degree)为4(4阶)的b+tree为例:
13.jpg
插入 100 65 169 368 900 556 780 35 215 1200 234 888 158 90 1000 88 120 268 250 数据为例。

相对于B-Tree区别:
①. 所有的数据都会出现在叶子节点
②. 叶子节点形成一个单向链表
MySQL索引数据结构对经典的B+Tree进行了优化。在原B+Tree的基础上,增加一个指向相邻叶子节点的链表指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。

-
Hash
哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。
如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可以通过链表来解决。
16.jpg
-
Hash索引特点
- Hash索引只能用于对等比较(=,in),不支持范围查询(between,>,< ,...)
- 无法利用索引完成排序操作
- 查询效率高,通常只需要一次检索就可以了,效率通常要高于B+tree索引
-
存储引擎支持
在MySQL中,支持hash索引的是Memory引擎,而InnoDB中具有自适应hash功能,hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。
17.jpg
-
1.3 索引分类

在InnoDB存储引擎中,根据索引的存储形式,又可以分为以下两种

聚集索引选取规则:
- 如果存在主键,主键索引就是聚集索引。
- 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
-
如果表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引。
20.jpg
21.jpg

1.4 索引语法
-
创建索引
CREATE [UNIQUE|FULLTEXT] INDEX index_name ON table_name(index_col_name,...);
-
查看索引
SHOW INDEX FROM table_name;
-
删除索引
DROP INDEX index_name ON table_name;
按照下列的需求,完成索引的创建
- name字段为姓名字段,该字段的值可能会重复,为该字段创建索引。
- phone手机号字段的值,是非空,且唯一的,为该字段创建唯一索引。
- 为profession、age、status创建联合索引。
- 为email建立合适的索引来提升查询效率。
CREATE INDEX idx_user_name on tb_user(name); CREATE UNIQUE INDEX idx_user_phone on tb_user(phone); CREATE INDEX idx_user_pro_age_sta ON tb_user(profession,age,status); CREATE INDEX idx_email on tb_user(email);
网友评论