索引优化

作者: 肉饼屋 | 来源:发表于2019-09-26 08:53 被阅读0次

MySQL，必须掌握的6个知识点
sql优化的一般策略
搜索引擎优化
17.MySQL优化
MySQL深入理解_SQL优化
增长黑客第三章(三)
小白入门 | 做好SEO优化，只需八步
Mysql索引
mysql 索引优化
MySql性能（9）- mysql的order by的工作原理

就像是一本书的目录一样，Mysql提供了索引来提高我们对于数据的查询速度，而如何用好它，就需要了解它的一些规则和原理。

测试数据

索引的类型

索引有很多种类型，可以为不同的场景提供更好的性能，索引是在存储引擎实现的而不是服务层，所以即使是同一种索引类型在不同的引擎中的实现可能也会有差异。

常见的索引类别:

B-Tree 索引，最常用的索引类型，现在默认都是用这个
哈希索引，通过对行数据进行哈希处理的一种索引类型
空间数据索引，用于地理位置的索引
全文索引，用于关键字搜索的索引

索引的优点

索引大大减少了Mysql服务器层需要扫描的的数据量
索引可以帮助服务器避免排序和使用临时表
索引可以将随机I/O变为顺序I/O

高性能的索引策略

想要正确的创建和使用索引，我们需要先知道索引的一些高性能策略

独立的列

"独立的列"是指索引列不能是表达式的一部分或者函数的参数。

下图为测试结果:

独立的列

通过上图，我们知道id为索引列，当它是表达式的一部分时，没有使用到索引。但是当它单独在比较符号的一侧是，使用了索引。性能上也有明显的差距。

前缀索引和索引选择性

有时候我们需要索引很长的字符列，这会让索引变得大而且慢，除了将字符列的数据进行哈希之外，我们还可以使用前缀索引来进行优化。

前缀索引是指取整个字符列的前面部分数据来作为索引，这样可以减低索引的空间大小，从而提高的索引效率。但是取字符列的前面几位是一个问题，如果位数太少，那么就会降低索引的选择性。索引的选择性是指:不重复的索引值（也称为基数,cardinality）和数据表的记录总数的比值，选择性越高则查询效率越高。当基数/记录总数=1时，该索引的选择性最好，例如主键。

在不同的场景下，因为存的不同的数据，所以需要选择的位数也不同，所以需要我们自己通过测试来选择使用的位数应该是多少，可以通过下面的sql语句来进行计算。

select count(distinct left(字符列,位数))/count(*) from 表名;

也可以通过下面的语句，在不同位数之间进行比较，当发现随着位数的提升，但是选择性没有明显增加时，这个位数可能就比较适合改字符列了。

select 
count(distinct left(字符列,1))/count(*),
count(distinct left(字符列,2))/count(*),
count(distinct left(字符列,3))/count(*),
count(distinct left(字符列,4))/count(*) 
from 表名;

下面我将根据《高性能Mysql》书中例子进行演示

完整字符列的选择性:

完整字符列的选择性

不同位数字符列的选择性:

不同位数字符列的选择性

通过上面两张图的对比我们可以知道，当位数到6的时候，选择性的提升幅度已经很微小了，所以这时候我们就可以在city字段上创建长度为6的前缀索引:

alter table city_demo add key(city(6));

但是我们不能通过前缀索引进行order by，下图并没有使用到索引

前缀索引排序

避免为各个列建立单独索引

在Mysql的最新版本中，Mysql能够同时使用单独列索引，并将结果进行算法合并，也将这个称为索引合并策略。这种算法有三种变种: OR条件的联合(union)，AND条件的相交(intersection)，组合前面两种情况的联合及相交)。

union
索引合并策略通常会消耗大量的cpu和内存资源，而这些消耗比较难通过mysql自身提供的工具进行监控，只能通过针对系统或者进程的监控程序才能知道。

选择合适的索引列顺序

不同类型的索引，它的存储结构是不一样的，限制也不一样，所以也决定了我们在定义索引时，需要选择合适的索引列顺序，才能真正的将索引的功能发挥出来，下面主要介绍B-Tree。

B-Tree限制

如果不是按照索引的最左列开始查询，则无法使用索引
不能跳过索引的列
如果查询中有某个列的范围查询，则其右边所有列都无法使用索引优化查找。
只有当索引的列顺序和order by子句的顺序完全一致，并且所有列的排序方向（倒序或正序）都一样时，才能使用索引来对结果进行排序。

通过这些B-Tree的限制应该能明白，定义索引列的顺序决定了你将如何使用索引。而这些规则试用于所有涉及索引的操作，例如基本查找、where子句、order by子句等

表结构和索引定义为:

索引定义

下面我们将主要使用rental_date这个索引进行举例:

例子1:

例子1
索引rental_date包含了rental_date、inventory_id、customer_id字段，在第一条语句中，按我们正常的理解来说，应该使用rental_date这个索引才对，但是并没有，因为该索引的最左列为rental_date，但是在where语句中，并没有该字段，所以不会使用rental_date这个索引。而第二条语句就符合索引的最左列的规则。

例子2:

例子2
这里将and换成or，结果并没有使用rental_date索引了，而是使用了上面提到的索引合并策略。我们自己细想一下，这样是合理的，因为B-Tree是一棵树，他只能只能先匹配最左字段，然后再匹配下一个字段。但是or要求的是rental_date和inventory_id一起找，这样单个B-Tree索引是无法完成这样的工作的。只能使用索引合并策略了，所以在用or的时候，可能需要注意下索引合并策略可能引起的一些问题。

例子3:

例子3
当语句的查询结果和搜索条件以及排序条件与索引项匹配，那么可以直接通过索引进行排序

例子4:

例子4
在这个例子使用的索引是rental_date，虽然order by只用到inventory_id，但是因为前面where子句中rental_date是一个常量条件，所以也可以使用相应的索引进行排序。

例子5:

例子5
这个例子中将inventory_id换成customer_id，还是使用了rental_date索引，但是并没有使用它进行排序，因为这条语句违反不能跳过索引的列这个规则。

例子6:

例子6

这个例子中两种排序字段的排序方向不一致，所以无法使用索引进行排序。

例子7:

例子7

在这个例子中where子句使用了范围查询，所以导致了无法使用索引进行排序

冗余和重复索引

Mysql允许在相同列上创建多个索引，通过上面的那些例子中就能发现一些字段存在于不同的索引中。如果一个索引是另一个索引的最左前缀，那么这个索引就冗余索引，这样的索引是没有什么意义的。过多的索引会导致数据库在修改表数据时变慢，并且增加资源的占用。通过上面的例子也可以发现，索引太多也会提升使用索引的复杂度。

索引和锁

下面有两条语句

begin;
select actor_id from actor where actor_id < 5 and actor_id != 1 for update;

begin;
select actor_id from actor where actor_id=1 for update;

按照预期来说，上面那条语句应该只会锁2-4行的数据，那么下面那条语句应该不会阻塞，但是在我当前的版本，还是出现了阻塞。原因在actor_id < 5是一个索引范围查询，导致InnoDB只会锁定actor_id<5的行，而不会执行后面的条件，所以导致actor_id != 1是在服务层通过where进行处理的。

例子8

通过上面的实例也能知道，这条语句先用索引过滤出<5的数据，然后在服务层用where进行二次过滤，在索引层会将对应的行锁住，导致第二条语句在执行被阻塞。

结尾

大部分人都知道当Mysql查询性能慢时，可以通过加索引的方式来提高性能。但是如何正确使用索引却并没有想象的那么简单，需要考虑未来会如何使用，然后定义相应的索引，也需要对查询语句进行修改来保证正确能使用相应的索引，也需要随着业务的发展，数据的变化，对索引进行维护来保证索引的高性能。

MySQL，必须掌握的6个知识点
目录一、索引B+ Tree 原理 MySQL 索引索引优化索引的优点索引的使用条件二、查询性能优化使用 ...
sql优化的一般策略
sql 优化的一般策略：索引优化，sql改写，参数优化，优化器索引优化以select * from vvsho...
搜索引擎优化
搜索引擎优化 SEO（Search Engine Optimization）:汉译为搜索引擎优化。搜索引擎优化是一...
17.MySQL优化
《高性能MySQL》——这本书都有的 “字段”优化总结 “索引”优化总结索引的优化 “查询SQL”优化总结 “引...
MySQL深入理解_SQL优化
索引优化1[https://juejin.im/post/6844903954392825869] 索引优化2[h...
增长黑客第三章(三)
关键词:捆绑下载,搜索引擎优化, 3.6 搜索引擎和应用商店的优化营销搜索引擎优化:利用搜索引擎的排序规则，通过...
小白入门 | 做好SEO优化，只需八步
SEO中文解释就是“搜索引擎优化”的意思，也可以理解为“百度搜索引擎优化”、“谷歌搜索引擎优化”、“360搜索引擎...
Mysql索引
提起优化 SQL，可能会把它理解为优化索引。简单来说这也不算错，索引在 SQL 优化中占了很大的比重。索引用得好，...
mysql 索引优化
索引的存储分类索引的创建与删除索引查看 mysql常用语句优化技巧定期优化表常用优化 2.应尽量避免在whe...
MySql性能（9）- mysql的order by的工作原理
全字段排序 rowid排序全字段排序和rowid排序3.1 联合索引优化3.2 覆盖索引优化优先队列算法优化...