MySQL索引知多少

作者: 我不是李小龙 | 来源:发表于2020-05-06 14:19 被阅读0次

MySQL索引知多少
MySQL索引及查询优化书目录
高性能的索引策略
MySQL索引的使用
Mysql索引与锁
索引（二）
MySQL 索引分类
MySQL--索引
mysql索引
5.2MySQL创建高性能索引考察点

mysql索引

总结关于mysql的索引，查询优化，SQL技巧等

1 索引类型

B-Tree索引
Hash索引（自定义hash索引 CRC32 ）
R-Tree索引（空间索引）使用不多，
全文索引

1.1 B-Tree索引

没有特殊说明的时候，通常说的索引都是B-Tree类型的，他是根据数据值进行tree结构创建的索引。

1.1.1 B-Tree索引特征

全值匹配，全值匹配指的是和索引中的所有列进行匹配。例如可以查询 last_name='Michael' and first_name='Bay' and birthday='2019-11-05 03:37:43' 的数据
匹配最左前缀，索引可用于最左一列的查询。例如查询 last_name='Steven' 的数据
匹配列前缀，匹配某一列的值的开头部分。例如查询 last_name 取值为a-j开头的数据
匹配范围值，索引可用于列值范围查询。例如查询 last_name 的取值在 aaa-bbb之前的值
精确匹配某一列并范围匹配另外一列
只访问索引的查询

1.1.2 B-Tree索引限制

如果不是按照索引的最左列开始查找，则无法使用索引。 例如上面例子中索引不能用于查找 col_B=xx的信息。因为col_B不是最左列
不能跳过索引中的列。例如查询 col_A=a, col_C=c的数据的时候，col_C不能使用索引，只能索引到col_A
如果查询中有某个列的范围查询，则其右边所有的列都无法使用索引优化查询。

1.1.3 B-Tree索引示例

-- 用户表
CREATE TABLE `t_user` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `last_name` varchar(32) DEFAULT NULL,
  `first_name` varchar(32) DEFAULT NULL,
  `birthday` datetime DEFAULT NULL,
  `email` varchar(32) DEFAULT NULL,
  `create_time` datetime DEFAULT NULL,
  `update_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `t_idx_ln_fn_bth` (`last_name`,`first_name`,`birthday`)
) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8"

-- 一下几种情况的结果
-- 索引使用到 last_name、first_name、birthday
explain select * from t_user where last_name='Michael' and first_name='Bay' and birthday='2019-11-05 03:37:43';

-- 没有使用到索引
explain select * from t_user where first_name='Bay' and birthday='2019-11-05 03:37:43';

-- 索引只使用到 last_name 列
explain select * from t_user where last_name='Michael' and birthday='2019-11-05 03:37:43';

-- 索引使用到列 last_name、first_name
explain select * from t_user where last_name='Michael' and first_name='Bay' ;

-- 索引到列 last_name
explain select * from t_user where last_name='Michael' and first_name like 'B%' and birthday='2019-11-05 03:37:43';

<em style='color:red;'>注意：根据索引的限制，我们可以在SQL优化的时候，从这个方向考虑，索引列的顺序，代码中使用查询语句时候，SQL语句的列的顺序都可以是优化的点</em>

1.2 Hash索引

1.2.1 Hash索引定义

hash索引是基于哈希表实现的，只有精确匹配索引所有列的查询才有效。对于每一行数据，存储引擎都会对数所有的索引列计算一个hash code,hash索引是将所有的hash code 和执向数据的指针存储在hash表中来实现的。对应hash冲突的处理，就是对冲突的数据以链表形式存储。

注意：MySQL中显示支持hash索引的只有 Memory引擎。

1.2.2 Hash索引限制

从hash索引的结构可以知道，由于索引使用存储hashcode ,所以体积小，结构紧凑。查询速度非常快。它的使用限制也非常明显：

哈希索引只包含哈希值和行指针，而不是存储字段值，所有必须要使用索引读取行
哈希索引数据并不是按照索引值顺序存储（hash值存储），所以不能排序
不能支持部分配置索引，因为索引存储的是全值计算出来的hash
同上面的原因，所以只能支持等值比较查询，包括 =, in() <=>
访问哈希索引的数据非常快，除非有很多哈希冲突，他哈希冲突时候，会去遍历链表
哈希冲突多的情况下，会增加索引维护的成本（要在链表中遍历进行增删操作）

1.2.3 自定义哈希索引

如果搜索引擎不支持索引，可以在创建一个hash值，然后利用b-tree索引这很hash值，在查询的where子句中指明这个hash值的列，效果就如同hash索引了。还可以通过选择更好的hash算法，可更加容易避免hash冲突,优化索引。

示例：

-- t_url 一个存储url的表，url地址可能很长，直接b-tree索引，索引空间大(b-tree索引的是值)
CREATE TABLE `t_url` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `url` varchar(255) DEFAULT NULL,
  `url_crc` bigint(20) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `t_idx_url_crc` (`url_crc`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8"

针对上面的示例，每次写入数据的时候，根据url的值使用CRC32函数生成 url_crc的值，查询的时候，使用CRC32(url)的值作为where条件，使他能够给被索引，同时需要添加 url作为条件，这样非常必要，因为hash值 CRC32函数的结果可能冲突，如果只按照这个值，可能查出多条，所以需要加上url的值，确定数据的准确性

查询表现为：

-- 没有使用索引
explain select * from t_url where url='https://www.baidu.com';

-- 使用索引列 url_crc
explain select * from t_url where url_crc=CRC32("https://www.baidu.com") and url='https://www.baidu.com';

<em style='color:red;'>注意：自定义索引，是平时的作为SQL优化的一个重要手段，hash值的创建可以使用触发器控制，也可以在应用中通过程序写入。</em>

1.3 R-Tree索引（空间索引）

这类索引使用所有维度来索引数据，mysql支持较弱

1.4 全文索引

它查找的是文本中的关键字，有点类似搜索引擎

2 索引的优点

1.索引大大减少了服务器需要扫描的数据量
2.索引可以帮助服务器避免排序和临时表
3.索引可以将随机I/O 变为顺序I/O

3 高性能的索引策略

3.1 独立的列

使用独立的列。独立列命中索引，不能是表达式，也不能是函数的参数

3.2 前缀索引

当被索引的列长度很长的时候，如 Text, BLOB, 或者长度很大的VARCHAR的时候，直接整列的索引会使得索引很大，性能差。此时有两种方式处理来优化。

使用前面说的建立自定义的hashs索引
使用列的前缀部分作为索引，前缀的长度选择在于索引的选择性控制

使用技巧

-- 计算完整列的选择性
select count(distinct city_name) / count(*) from t_city

-- 分别计算前缀取长度为 4、5、6、7的选择性
select count(distinct LEFT(city_name, 4)）/ count(*) as sel4, 
       count(distinct LEFT(city_name, 5)）/ count(*) as sel5,
       count(distinct LEFT(city_name, 6)）/ count(*) as sel6,
       count(distinct LEFT(city_name, 7)）/ count(*) as sel7
        from t_city

通过上面的方法，找到前缀长度与整列选择性接近的值作为前缀索引长度。

通过设置索引长度来指明前缀索引的长度，如

-- 指定city_name 上面建立长度为7的前缀索引
alter table t_city add key (city_name(7));

缺点
虽然前缀索引可以优化索引的大小，但是用前缀索引后，无法使用前缀索引做ORDER BY 和 GROUP BY ,也无法使用前缀索引做覆盖扫描。（从索引内容只有部分前缀，就可以理解了）

3.3 多列索引

在多个列上面建立单独索引后，如果出现大量的索引合并，可以考虑建立多列索引，调整优化索引列的顺序来达到建立更高效的索引的目的。

索引列的顺序使用选择后得到结果集数量越小的排在越前面，或者使用上面的选择性判断方式，使用选择性高的列在前面，例如：

-- 使用SUM匹配上的行数，匹配上的行数越少，索引检索越有价值
select count(*). SUM(groupId=10137), SUM(userId=1288826), SUM(anonymous=0) from message

-- 根据选择性判断，选择行数在总基数比例越大  选择性越高
select count(distinct(staff_id))/count(*) as staff_id_selected,
count(distinct(customer_id))/count(*) as customer_id_selected,
count(*) from payment

3.4 聚簇索引

聚簇索引并不是一种单独的索引类型，而是一种数据存储的方式。

3.4 覆盖索引

如果索引的叶子节点中已经包含了要查询的数据，那么就没有必要再回表查询，这种一个索引包含（或者说覆盖）所有需要查询的字段的值的索引，我们称之为覆盖索引

4 查询优化

4.1 优化数据访问

查询结果需要的数据方面考虑

对于不需要的数据，不要查询出来，会加大网络开销
多表关联的时候，不要返回全部列，应该返回需要的列
select * 这种，需要考虑是否真的需要全部列的信息
重复查询的数据，可以使用缓存，减少数据库查询

查询扫描的行数考虑

观察响应时间，在慢日志中，找出扫描行数多的查询
通过explain分析（type字段的类型来分析）
合适的创建索引来优化

4.2 重构查询的方式

做复杂化查询还是查分多个简单查询。不可以去拆分，但拆分的数据库连接的网络消耗应没有以前那么大。
分解关联查询，在应用程序中进行合并。可以有效利用应用层的缓存，利用中间查询的结果，避免重复查询和数据锁的竞争。

4.3 查询执行的基础

4.4 优化特定类型查询

4.4.1 COUNT()查询优化

count(col) 统计当前类不为null的数据， count(*)直接统计行数
在同一个查询中统计同一个列的不同值的数量。使用SUM 或者COUNT(),例如select SUM(id>3) as a , SUM(id<3) as b from t_user; , select count(id>3 or null ) as a, count(id<3 or null) as b from t_user;
count在值是NULL是不统计数，（count('任意内容')都会统计出所有记录数，因为count只有在遇见null时不计数，即count(null)==0，因此前者单引号内不管输入什么值都会统计出所有记录数），至于加上or NULL ，很像其他编程里的or运算符，第一个表达式是true就是不执行or后面的表达式，第一个表达式是false 执行or后面的表达式当a中id<3, id>3 or NULL 的结果是NULL，Count才不会统计上这条记录数

5 常见复杂查询

记录常见的一些复杂查询的实现方式（仅使用数据库）

5.1 分组查询取最大、最小、前N、后N 条记录

MySQL索引知多少
mysql索引总结关于mysql的索引，查询优化，SQL技巧等 1 索引类型 B-Tree索引 Hash索引 ...
MySQL索引及查询优化书目录
MySQL索引的原理之索引目的 MySQL索引的原理之索引原理 MySQL索引的原理之索引的类型 MySQL索引的...
高性能的索引策略
MySQL查询基础-查询执行过程 MySQL聚簇索引 MySQL覆盖索引 MySQL索引扫描排序 MySQL冗余和...
MySQL索引的使用
MySQL索引 MySQL索引可以快速提高MySQL的检索速度。索引分单列索引和组合索引单列索引：即一个索引只包含...
Mysql索引与锁
本文以Mysql5.7为例测试。 1：mysql索引方法 Mysql的索引方法分为btree索引和hash索引。 ...
索引（二）
mysql索引的新手入门详解mysql索引之三：索引使用注意规则索引（Index）是帮助 MySQL 高效获取数...
MySQL 索引分类
MySQL索引的分类（根据数据结构）索引的本质 MySQL官方对索引的定义为：索引（Index）是帮助MySQL...
MySQL--索引
MySQL索引查看索引创建索引创建唯一索引创建主键索引删除索引删除主键 MySQL视图创建视图删除...
mysql索引
索引 mysql索引的建立对于mysql的高效运行是很重要的，索引可以大大提高mysql的检索速度。索引分单列索引...
5.2MySQL创建高性能索引考察点
MySQL索引的基础和类型延伸：MySQL索引的创建原则延伸：MySQL索引的注意事项索引的基础索引类似于书籍的...