美文网首页程序员小天地
聚簇索引和二级索引

聚簇索引和二级索引

作者: 小草莓子桑 | 来源:发表于2022-01-29 22:49 被阅读0次

前段时间处理了一个mysql优化问题,涉及到聚簇索引和二级索引,今天来简单说下,因为我们的mysql用的是innodb索引,所以本文中都是以innodb索引为基础

先背书

聚簇索引

  • 聚簇索引通过表的主键构建一个B+tree树
  • 构建成的B+tree树叶子节点存放每一行的所有字段数据,也把叶子节点称为数据页
  • 每张表只能拥有一个聚簇索引
  • 如果没有定义主键,innodb会选择非空的唯一索引(第一个唯一索引)代替
  • 如果自定义主键和唯一索引都没有的话,innodb会生成一个隐式主键id,来做聚簇索引

二级索引

  • 也叫辅助索引或者非聚簇索引
  • 聚簇索引不一样的是,二级索引的叶子节点不存储行数据了,除了键值之外,还包含了相应行数据的聚簇索引对应列的值
  • 在查询二级索引时,先查询到叶子节点上相应行数据的聚簇索引对应列的值,再去查询聚簇索引查询到数据
  • 一张表可以有多个二级索引

直接上栗子

  • 用户类别表,主要有四个字段id(主键id), user_id(用户id), cate_id(用户类别), update_time(数据写入时间)
  • 索引的话,就id(主键id)创建一个主键索引,user_id(用户id) 和 cate_id(用户类别)创建一个联合索引,建表语句如下:
CREATE TABLE `t_user_cate` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `user_id` bigint(20) NOT NULL COMMENT '用户ID',
  `cate_id` varchar(20) NOT NULL COMMENT '用户类别ID',
  `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '数据插入/更新时间(会自动更新,不需要刻意程序更新)',
  PRIMARY KEY (`id`),
  KEY `idx_user_cate_id` (`user_id`,`cate_id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='写文章使用,用户类别表'
  • 插入过程略

t_user_cate表的聚簇索引展示

  • 因为有创建了id为主键索引,所以 t_user_cate表的聚簇索引在字段id上的

  • 聚簇索引B+tree的示例如下:


    聚簇索引
  • 如图来看

  • 叶子节点使用单链表链接,按id列递增链接,方便基于范围的顺序检索

  • 聚簇索引的叶子节点存储完整一行表数据,每个聚簇索引下都是每一行的完整数据

  • 通过主键id查询时候,因为叶子节点已经存储了完整的每一行的数据,查询的效率非常高

t_user_cate表的二级索引展示

  • 画图时忽略联合索引idx_user_cate_id,因为图不上不好画,我就直接画成单索引
  • 二级索引B+tree的示例如下:
二级索引
  • 二级索引的叶子节点,存储聚簇索引所在列的值,最后通过查询到聚簇索引列的值再去回表查询

回表查询

  • 说下回表查询
  • 因为二级索引叶子节点不像聚簇索引那样,不存储完整的行数据,存储的是聚簇索引所在列的值,所以还需要通过查询到的值查询聚簇索引,是会损耗一点性能的
  • 比如说这个sql
SELECT
  *
FROM
  t_user_cate
where
  user_id = 1123
  • 回表查询如下:
回表查询
  • 查询过程如下:
  • 第一步:通过二级索引user_id查询,user_id=1123,查询到叶子节点,存储的是聚簇索引列id查询到对应的id列的值为1
  • 第二步:通过上一步查询到的id=1,再来查询聚簇索引查询到所涉及到所有行的数据

回表的两种情况

  • 查询二级索引时候,回表不是必要步骤
  • 当你查询的所有字段都是索引字段时,这时候不需要进行回表查询,例如:
SELECT
  user_id,
  cate_id
FROM
  t_user_cate
where
  userid = 1123
  • 查看该sql的执行计划:


    不需要回表查询的执行计划
  • 注意最后一列Extra,值是Using index,代表查询的字段是索引覆盖的,所以本次查询没有进行回表查询

  • 当你查询的字段有的不在索引范围内,这时候就会进行回表查询,例如:

SELECT
  user_id,
  cate_id,
  update_time 
FROM
  t_user_cate
where
  userid = 1123
  • 这次查询字段多增了一个update_time字段,本字段不在索引中,再来看执行计划:
需要回表查询的执行计划
  • 对于上一个sql的执行计划,执行计划中的字段基本和上一个sql一致,只有Extra字段不一样,本次执行计划中Extra字段为空,说明没有索引覆盖查询需要走回表查询

聚簇索引优缺点总结

  • 通过上面例子,我们来总结一下聚簇索引的优缺点

优点

  • 数据查询效率高,因为聚簇索引构建的B+tree的叶子节点存放完整的行数据,所以通过聚簇索引查询比二级索引查询速度快
  • 基于主键的排序查找、范围查找效率高

缺点

  • 数据写入时候,比较依赖于主键的顺序插入,所以都需要我们自定义一个自增主键
  • 更新主键的代价很高,会导致被更新的行移动

聚簇索引和二级索引说到这里,欢迎大家来交流,指出文中一些说错的地方,让我加深认识,愿大家没有bug,谢谢!

相关文章

  • MYSQL Innodb中的聚簇索引和非聚簇索引

    聚簇索引 数据库表的索引从数据存储方式上可以分为聚簇索引和非聚簇索引(又叫二级索引)两种。存储引擎Innodb中的...

  • # 索引

    InnoDB来说:主键=聚簇索引(clustered index ),非主键=非聚簇索引=是二级索引=辅助索引(s...

  • MySql数据库相关

    聚簇索引与非聚簇索引(也叫二级索引) 通俗点讲 聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据 非聚...

  • MySQL索引

    聚簇索引和非聚簇索引 只有Innodb有聚簇索引,MyISAM引擎没有聚簇索引。 主键一定是聚簇索引,MySQL的...

  • MySQL:聚簇索引

    什么是聚簇索引?什么时候使用聚簇索引和非聚簇索引? 聚簇索引:将数据存储与索引放到了一块,找到索引也就找到了数据非...

  • 数据库

    介绍一下聚簇索引和非聚簇索引 聚簇索引(innobe)的叶子节点就是数据节点 而非聚簇索引(myisam)的叶子节...

  • 索引

    mysql中的索引 MySQL中普遍使用B+Tree做索引,但在实现上又根据聚簇索引和非聚簇索引而不同。 聚簇索引...

  • 聚簇索引和二级索引

    聚簇索引 索引和数据存储在一块( 都存储在同一个B*tree 中)。一般主键索引都是聚餐索引 Mysql中Inno...

  • 聚簇索引和二级索引

    前段时间处理了一个mysql优化问题,涉及到聚簇索引和二级索引,今天来简单说下,因为我们的mysql用的是inno...

  • 五、如何有效使用 MySQL 的索引

    由上一篇可以了解到,索引分为主键索引(聚簇索引)和 非主键索引(二级索引),那么如何有效地利用这些索引呢? 先考虑...

网友评论

    本文标题:聚簇索引和二级索引

    本文链接:https://www.haomeiwen.com/subject/kunfkrtx.html