美文网首页mysql程序员
MySQL 多列索引优化小记

MySQL 多列索引优化小记

作者: liangzai_cool | 来源:发表于2017-03-27 09:54 被阅读48次

MySQL 5.6.30

问题背景

由于爬虫抓取的数据不断增多,这两天在不断对数据库以及查询语句进行优化,其中一个表结构如下:

CREATE TABLE `newspaper_article` (
  `id` varchar(50) NOT NULL COMMENT '编号',
  `title` varchar(190) NOT NULL COMMENT '标题',
  `author` varchar(255) DEFAULT NULL COMMENT '作者',
  `date` date NULL DEFAULT NULL COMMENT '发表时间',
  `content` longtext COMMENT '正文',
  `status` tinyint(4) DEFAULT '0',
  PRIMARY KEY (`id`),
  KEY `idx_status_date` (`status`,`date`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='文章表';

根据业务需要,添加了 idx_status_date 索引,在执行下面这个 SQL 时特别耗时:

SELECT id, title, status, date FROM article WHERE status > -2 AND date = '2016-01-07';

根据观察,每天新增的数据大概在2500条以内,本以为这里指定了具体某天的日期 '2016-01-07' ,实际需要扫描的数据量应该在2500条以内才对,但实际并非如此:

EXPLAIN
实际共扫描了185589条数据,远远高于预估的2500条,且实际执行时间都将近3秒钟: EXPLAIN

这是为什么呢?

解决方案

idx_status_date (status, date) 改为 idx_status (status) 后,查看 MySQL 执行计划:

EXPLAIN

可以看到将多列索引改为单列索引后,执行计划要扫描的数据总量没有任何变化。结合多列索引遵循最左前缀原则,推测上面的查询语句只使用了 idx_status_date 最左边的 status 的索引。

翻了下《高性能MySQL》找到了下面这段话,证实了我的想法:

如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查找。例如有查询 WHERE last_name = 'Smith' AND first_name LIKE 'J%' AND dob = '1976-12-23' ,这个查询只能使用索引的前两列,因为这里 LIKE 是一个范围条件(但是服务器可以把其余列用于其他目的)。如果范围查询列值的数量有限,那么可以通过使用多个等于条件来代替范围条件。

因此,这里解决思路有两种:

  • 可以通过使用多个等于条件来代替范围条件
  • 修改 idx_status_date (status, date) 为索引 idx_date_status (date, status) ,并新建一个 idx_status 索引,即可达到同样的效果。

优化后的执行计划:

EXPLAIN

实际执行结果:

EXPLAIN

总结

当人们谈论索引的时候,如果没有特别指明类型,那么多半说的是 B-Tree 索引,它使用 B-Tree 数据结构来存储数据。我们使用术语“B-Tree”,是因为 MySQL 在 CREATE TABLE 和其他语句中也使用该关键字。不过,底层的存储引擎也可能使用不同的存储结构。InnoDB使用的是B+Tree。
假如有如下数据表:

CREATE TABLE People (
  last_name  varchar(50)    not null,
  first_name varchar(50)    not null,
  dob        date           not null,
  gender     enum('m', 'f') not null,
  key(last_name, first_name, dob)
);

B-Tree 索引对如下类型的查询有效

  • 全值匹配
    全值匹配指的是和索引中的所有列进行匹配,例如上表的索引可用于查找姓名为 Cuba Allen 、出生于 1960-01-01 的人。
  • 匹配最左前缀
    上表中的索引可用于查找所有姓为 Allen 的人,即只使用索引的第一列。
  • 匹配列前缀
    只匹配某一列的值的开头部分。例如上表的索引可用于查找所有以 J 开头的姓的人。这里也只使用了索引的第一列。
  • 匹配范围值
    例如上表中的索引可用于查找姓在 Allen 和 Barrymore 之间的人。这里也只使用了索引的第一列。
  • 精确匹配某一列并范围匹配另外一列
    上表的索引也可用于查找所有姓为 Allen ,并且名字是字母 K 开头(比如 Kim 、 Karl 等)的人。即第一列 last_name 全匹配,第二列 first_name 范围匹配。
  • 只访问索引的查询
    B-Tree 通常可以支持“只访问索引的查询”,即查询只需要访问索引,而无须访问数据行。

B-Tree 索引的一些限制

  • 如果不是按照索引的最左列开始查找,则无法使用索引。例如上表的索引无法用于查找名字为 Bill 的人,也无法查找某个特定生日的人,因为这两列都不是最左数据列。类似地,也无法查找姓氏以某个字母结尾的人。
  • 不能跳过索引中列。也就是说,上表的索引无法用于查找姓氏为 Smith 并且在某个特定日期出生的人。如果不指定名(first_name),则 MySQL 只能使用索引的第一列。
  • 如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查找。例如有查询 WHERE last_name = 'Smith' AND first_name LIKE 'J%' AND dob = '1976-12-23' ,这个查询只能使用索引的前两列,因为这里 LIKE 是一个范围条件(但是服务器可以把其余列用于其他目的)。如果范围查询列值的数量有限,那么可以通过使用多个等于条件来代替范围条件。

原文链接http://xueliang.org/article/detail/20170326235631083

相关文章

  • MySQL 多列索引优化小记

    MySQL 5.6.30 问题背景 由于爬虫抓取的数据不断增多,这两天在不断对数据库以及查询语句进行优化,其中一个...

  • 索引

    MYSQL索引 MYSQL中索引文件以B树结构存储,索引可分为单列索引和多列索引。 对于多列索引中,当一个SQL语...

  • MySQL优化

    MySQL语句优化原则 1. 小表驱动大表(针对查询),可以减少IO 2. 最左前缀法则(针对索引),索引了多列的...

  • sql优化的几种方法

    Mysql的优化,大体可以分为三部分:索引的优化,sql语句的优化,表的优化 1.索引的优化 只要列中含有NULL...

  • MySql 数据查询优化

    1. MySQL索引类型: mysql的索引有5种:主键索引、普通索引、唯一索引、全文索引、聚合索引(多列索引)。...

  • MySQL 多列索引

    MySQL 多列索引 多列索引也叫联合索引又叫复合索引也就是把多个字段按顺序连起来创建一个索引 ( 最多16列 ...

  • MySQL多列索引

    MySQL多列索引 1 INNODB引擎为什么适用B+树,而不适用hash? 1.1 hash的特点 哈希优点: ...

  • mysql多列索引

    mysql多列索引 复合索引 这几天面试了一家公司,面试官问了个关于复合索引的,本以为对索引数据结构很了解了,谁知...

  • Java基础(十一)

    MySQL 索引 优化 插入 Mysql插入值,插入一个空行(前提为not null的列得有默认值) INSERT...

  • Mysql 索引原理及优化

    Mysql 索引原理及优化 什么是索引 为什么需要索引? 索引是数据表种一个或者多个列进行排序的数据结构 索引能够...

网友评论

    本文标题:MySQL 多列索引优化小记

    本文链接:https://www.haomeiwen.com/subject/llwlottx.html