美文网首页数据库
[数据库之十二] 数据库索引之覆盖索引

[数据库之十二] 数据库索引之覆盖索引

作者: 小胡_鸭 | 来源:发表于2021-06-11 05:04 被阅读0次

    1、MySQL 中的聚簇索引

      对于 MySQL InnoDB 引擎来说,表必须要有聚簇索引(也叫聚集索引),设定的规则如下:

    1) 如果表设置了主键,则主键就是聚簇索引
    2) 如果表没有主键,则会默认第一个NOT NULL,且唯一(UNIQUE)的列作为聚簇索引
    3) 以上都没有,则会默认创建一个隐藏的row_id作为聚簇索引
    

      InnoDB 会为聚簇索引创建一个 B+ 树,并且叶子结点存储的是行记录(其实是页结构,一个页包含多行数据),B+ 树高度达到 3 一般就能为千万级别的数据建立索引,根据主键最多只需要 1~3 次 IO操作就能查到所要的数据。

      普通索引也叫二级索引,一般也会为它建立一个 B+ 树,是一个非聚簇索引,叶子结点存储的主键的值(InnoDB),如果是 MyISAM 存储的是记录指针。


    2、实例演示

    • 建表
    mysql> create table user(
        -> id int(10) auto_increment,
        -> name varchar(30),
        -> age tinyint(4),
        -> primary key (id),
        -> index idx_age (age)
        -> )engine=innodb charset=utf8mb4;
    

    id 字段是聚簇索引,age 字段是普通索引(二级索引)

    • 填充数据
    insert into user(name,age) values('张三',30);
    insert into user(name,age) values('李四',20);
    insert into user(name,age) values('王五',40);
    insert into user(name,age) values('刘八',10);
    
    mysql> select * from user;
    +----+--------+------+
    | id | name  | age |
    +----+--------+------+
    | 1 | 张三  |  30 |
    | 2 | 李四  |  20 |
    | 3 | 王五  |  40 |
    | 4 | 刘八  |  10 |
    +----+--------+------+
    
    • 索引存储结构

    id 是主键,所以是聚簇索引,其叶子节点存储的是对应行记录的数据

    age 是普通索引(二级索引),非聚簇索引,其叶子节点存储的是聚簇索引的的值。

    如果查询条件为主键(聚簇索引),则只需扫描一次B+树即可通过聚簇索引定位到要查找的行记录数据。
    如:select * from user where id = 1;

    如果查询条件为普通索引(非聚簇索引),需要扫描两次B+树,第一次扫描通过普通索引定位到聚簇索引的值,然后第二次扫描通过聚簇索引的值定位到要查找的行记录数据。 如:select * from user where age = 30;

    1. 先通过普通索引 age=30 定位到主键值 id=1
    2. 再通过聚集索引 id=1 定位到行记录数据
    

    普通索引查找第一步

    普通索引查找第二步

    先通过普通索引的值定位聚簇索引值,再通过聚簇索引的值定位行记录数据,需要扫描两次索引 B+ 树,它的性能较扫一遍索引树更低,这种操作叫回表查询

    如果普通索引的列和主索引的列,刚好能满足 SQL 查询中要 select 的列,如下所示:

    例如:select id,age from user where age = 10;
    

    那么只需要在非聚簇索引的树上查询一次就能获取所有的列数据,无需回表,数据更快,这叫覆盖索引


    3、如何实现覆盖索引及避免回表

    常见的方法是:将被查询的字段,建立到联合索引里去。
    1、如实现:select id,age from user where age = 10;
    explain分析:因为age是普通索引,使用到了age索引,通过一次扫描B+树即可查询到相应的结果,这样就实现了覆盖索引

    2、实现:select id,age,name from user where age = 10;
    explain分析:age是普通索引,但name列不在索引树上,所以通过age索引在查询到id和age的值后,需要进行回表再查询name的值。此时的Extra列的NULL表示进行了回表查询

      为了实现索引覆盖,需要建组合索引idx_age_name(age,name)。

    drop index idx_age on user;
    create index idx_age_name on user(`age`,`name`);
    

    explain分析:此时字段age和name是组合索引idx_age_name,查询的字段id、age、name的值刚刚都在索引树上,只需扫描一次组合索引B+树即可,这就是实现了索引覆盖,此时的Extra字段为Using index表示使用了索引覆盖。


    4、适用索引覆盖优化的场景

    • 全表 count 查询优化
    mysql> create table user(
        -> id int(10) auto_increment,
        -> name varchar(30),
        -> age tinyint(4),
        -> primary key (id),
        -> )engine=innodb charset=utf8mb4;
    

    例如:select count(age) from user;

    使用索引覆盖优化:创建age字段索引

    create index idx_age on user(age);
    
    • 列表查询回表优化

    前文在描述索引覆盖使用的例子就是
    例如:select id,age,name from user where age = 10;
    使用索引覆盖:建组合索引idx_age_name(age,name)即可

    • 分页查询

    例如:select id,age,name from user order by age limit 100,2;
    因为name字段不是索引,所以在分页查询需要进行回表查询,此时Extra为Using filesort文件排序,查询性能低下。

    使用索引覆盖:建组合索引idx_age_name(age,name)

    相关文章

      网友评论

        本文标题:[数据库之十二] 数据库索引之覆盖索引

        本文链接:https://www.haomeiwen.com/subject/jhqpeltx.html