美文网首页
面试题-Mysql索引原理

面试题-Mysql索引原理

作者: 别明天就今天吧 | 来源:发表于2020-08-07 16:46 被阅读0次

    Mysql面试题中索引肯定是重中之重。

        刚工作那会第一次面试,就被问到了索引,我还记得当时的场景

        问:知道Mysql的索引吗?

        答:知道。

        问:然后又问为什么要加索引?

        答:我回答索引就像目录一样,能提升查找速度。

        大家是不是感觉弱爆了,随着工作经验的增加,我对索引有了更深入的了解,下面就来分享下我眼中的索引,分享以问题的形式,从敲门到进门。

    一、如果数据库中出现了慢查询怎么办?

    Anw:加索引可以提升查找效率。

    二、什么是索引?

    Anw:索引是一种数据结构,Mysql的索引使用B+树实现,B+树可以快速搜索到想要的数据。

    三、哪些数据结构可以做索引?

    先来解释几个概念后续能用到:

    节点的度:节点拥有子树的个数

    树的度    :节点度的最大值

    树的高度:树的层数

    1.哈希表

    哈希是一种算法,通过哈希算法可以算出索引下标这样就确定了数据所在的位置,实际上是一种数组结构,如果两个数据计算出的下标相同,则以链表的形式添加元素,这种数据结构的好处是它可以很快的定位到数据,但是不支持范围查询,JAVA语言中我们最常用的HashMap就是使用的这种结构,数组+链表+红黑树,至于为什么有红黑树,当链表过长时查询效率降低。转为红黑树提升查询效率。

     2.平衡二叉树

    一颗典型的树形结构,有根节点、左子树、右子树,左子树小于右子树,每个节点只有一个元素,支持范围查找,但是效率不如哈希表。

    3.B树

    和平衡二叉树差不多,但是树的度更大,也就是B树每个节点可以可以存储多个元素,索引和数据存在一起。

     4.B+树

    与B树的不同点在于,它的非叶子节点存放着索引,叶子节点存放数据,而且叶子节点通过链表链接在一起,它的优势在于,非叶子节点只存放索引它能够容纳更多的索引,树高比B树低,IO次数少,查询效率更高。

    四、MysqlB+树中一个节点的大小有多大?

    一个节点的大小为一页,一页是指Mysql中的一页,大小为16k,而操作系统中一页的大小为4k,那么也就是Mysql的一页=操作系统的四页。

    五、Mysql的节点大小为一页16k,为什么是16k?

    先来张图,看下主键索引和辅助索引

    可以看到主键索引树上,存放着数据和索引,而辅助索引存放着索引和主键索引的位置,如果通过主键索引查询,直接在主键索引树就可以找到数据,如果通过辅助索引查找则还需要通过找到的主键索引值,回到主键索引树找到数据,称为回表。

    非叶子节点:主键、指针

    叶子节点:数据

    叶子节点:一个节点的大小是一页16k,假设一条数据大小1k,则一个节点可以存放16条数据。

    非叶子节点:一般来说主键id的类型是bigint(10)10b,Innodb引擎中指针为6b,那么一页可以存放 16000b/(10b+6b)=1000个索引,那么一颗高度为2的b+树可以存放1000*16=16000条数据,一颗高度为3的b+树可以存放1000*1000*16=16000000,哇哦 1600W条数据,是不是有惊人。查找数据的时候一次页的查找代表一次IO,那么通过主键查找一般只需要3次以内的IO就可以找到数据,这个大小是可以调整的,但一般不会调整。

    六、什么是覆盖索引?

        一般来说通过辅助索引查找数据时,先在辅助索引找到主键索引的位置,然后再去主键索引树查找数据,回表操作会耗费性能,如果查询的结果就是辅助索引,如select 辅助索引 from table,这样就可以避免回表,直接返回结果。

    七、什么是联合索引?

        假设建立了a、b、c为顺序的联合索引,相当于建立a,(a、b),(a、b、c)三个索引

    查询bc肯定是用不到索引的,a、ab、ba、abc、acb都可以使用到索引的。

    八、什么是索引下推?

        还是那个假设,建立了a、b、c为顺序的联合索引

    select * from table where a=10 and b like '%b' and d like '%d'

    没有索引下推:先找到a=10的数据,返回mysql服务端,服务端根据条件遍历这些数据,是否有符合的数据。

    索引下推:先返回符合a=10的索引,然后判断b like '%b' and d like '%d'符合条件的索引,符合条件,则找到数据,不符合直接拒绝。

    有了索引下推,可以在like的时候减少回表次数。

    九、重复值较多的字段不建议建立索引

        重复值较多的话,如果通过这个字段进行查询,则需要频繁的回表,降低效率,效率还不如主键索引树查询。

    十、Mysql order by索引

    order by的字段,可以是联合索引,不能是函数。

    感谢各位老铁阅读,更多请关注公众号:别明天就今天吧

    相关文章

      网友评论

          本文标题:面试题-Mysql索引原理

          本文链接:https://www.haomeiwen.com/subject/bophdktx.html