美文网首页
案例分析之mysql选错索引

案例分析之mysql选错索引

作者: 温岭夹糕 | 来源:发表于2021-03-24 21:48 被阅读0次

前言
案例取自极客时间《mysql45讲》

案例

//建表
CREATE TABLE `t` (
       `id` int(11) AUTO_INCREMENT NOT NULL,
      `a` int(11) DEFAULT NULL,
       `b` int(11) DEFAULT NULL,
       PRIMARY KEY (`id`),
       KEY `a` (`a`),
       KEY `b` (`b`)
     ) ENGINE=InnoDB;
//插数据
 delimiter ;;
 create procedure idata()
     begin
       declare i int;
      set i=1;
       while(i<=100000)do
         insert into t(a, b) values(i, i);
         set i=i+1;
       end while;
     end;;
 delimiter ;
 call idata();

模拟执行器分析查询语句

explain select * from t where a between 20000 and 30000
//结果为选择key=a且 rows = 10001
// 即使用a索引,扫描了1万行数据  

场景复现

//sessionA开启会话不提交
 start transaction with consistent snapshot;
//sessionB删除数据且用存储过程重新插入
delete from t;
call idata();
//sessionB执行查询分析(sessionA并未提交)
explain select * from t where a between 20000 and 30000
//结果为选择key=null且 rows = 104157

奇了怪了,此时没用索引,进行了全表扫描

//sessionB强制使用索引试一下(sessionA并未提交)
explain select * from t  force index(a)  where a between 20000 and 30000
//结果为选择key=a 且 rows = 37116

虽然使用了索引,但是还是扫描了37116行,不妨结合之前的知识分析一下:
1.另一个事务未提交,需要保存之前的数据的数据版本,因此delete10万行数据实际是标记数据,这样每一行数据就有两个数据版本,旧的是delete之前的,新的是标记为delete的,索引a上的数据有两份
2.那还多出来的1万7呢,之前介绍过索引树的叶子节点存的是主键,select * 还要进行回表查询,这里将回表的扫描行数一并算上

为什么会选错索引
选择索引是优化器的工作,优化器要找到最优的执行方案并选择最小的代价去执行,扫描行数是影响执行代价之一(扫描越小,访问磁盘次数越少,消耗CPU资源越少)
mysql执行语句之前需要通过根据信息来统计记录数
这个统计信息就是索引的区分度,即索引上不同的值越多,区分度越高越好(show index t 的 cardinality字段查看),索引的区分度是利用采样统计得到的即取小部分统计信息再乘以整体。
除了使用统计信息,还会计算回表代价(主键不需要回表)
如果是统计信息不对那就修正

analyze table t
explain select * from t where a between 20000 and 30000
//sessionA提交
commit

另一种场景复现


explain select * from t where (a between 1 and 1000) and (b between 50000 and 100000) order by b limit 1;

按理说这是个空集,利用索引a只扫描1000行,利用索引b要扫描50000行,这里优化器竟然选择了索引b!!
mysql又选错了索引
解决办法

//强制使用索引a,ok结果与预期相符
explain select * from t force index(a)  where (a between 1 and 1000) and (b between 50000 and 10000)00000)

2.引导使用a索引

改为 order by a,b limit 1;

我们知道索引树上的数据是有序的,优化器使用b索引,一方面是认为索引b可以避免排序 ,order by a,b强制按照a,b排序意味着两个都需要排序,因此扫描行数成了影响决策的主要条件
3.删掉索引b

小结

解决mysql选错索引主要有两大方向
1.强制指定索引
2.干涉优化器选择(比如增大limit数量,增加order by ,写成子查询)

参考

MySQL选错索引导致的线上慢查询事故
mysql中走与不走索引的情况汇集(待全量实验)

相关文章

  • 案例分析之mysql选错索引

    前言案例取自极客时间《mysql45讲》 案例 模拟执行器分析查询语句 场景复现 奇了怪了,此时没用索引,进行了全...

  • 丁奇-MySQL实战读书笔记10

    MySQL为什么有时候会选错索引? 1:MySQL选错索引,啥意思? 我们认为使用K索引检索的速度会更快的,但是M...

  • mysql选错索引

    为什么会出现选错索引 优化器会判定当前执行的最优方式,主要包括考虑扫描的行数、是否使用临时表、是否需要排序等; 优...

  • MySQL索引及查询优化书目录

    MySQL索引的原理之索引目的 MySQL索引的原理之索引原理 MySQL索引的原理之索引的类型 MySQL索引的...

  • MySQL索引优化案例分析

    MySQL中的索引分类 按算法来分类包括B+Tree、Hash两种,大多数情况下会采用B+Tree。B+Tree与...

  • 10 - MySQL选错索引

    关键字 索引选择 0.错误情况 首先,建立一个简单的表,表中有 a、b 两个字段,并且分别建立了索引: 然后,我们...

  • MySQL索引

    MySQL索引 索引介绍 索引原理与分析 组合索引 索引失效分析 索引介绍 什么是索引索引:包括聚集索引、覆盖索引...

  • MySQL索引背后的数据结构及算法原理

    参考来源 mysql索引分析 MySQL索引背后的数据结构及算法原理 MySQL中EXPLAIN命令详解 索引连接...

  • 为何MySQL会选错索引

    在实际的生产环境中,给MySQL的字段加索引让查询的效率更高,我们往往会给MySQL的表字段加索引。MySQL具体...

  • mysql听讲(十)

    本文源自 极客网站 的某知名大佬讲mysql,整理一下心得和重点。 第10节 mysql为什么会选错索引 mys...

网友评论

      本文标题:案例分析之mysql选错索引

      本文链接:https://www.haomeiwen.com/subject/yuoqhltx.html