美文网首页
mysqI索引结构,特点,为什么使用这个

mysqI索引结构,特点,为什么使用这个

作者: 尘埃里的玄 | 来源:发表于2021-10-12 14:49 被阅读0次

why

为什么哈希表、完全平衡二叉树、B树、B+树都可以优化查询,为何Mysql独独喜欢B+树?

1、哈希表有什么特点?

假如有这么一张表(表名:sanguo):


image.png

现在对name字段建立哈希索引:


image.png
注意字段值所对应的数组下标是哈希算法随机算出来的,所以可能出现哈希冲突。那么对于这样一个索引结构,现在来执行下面的sql语句:
select * from sanguo where name='周瑜';

可以直接对‘周瑜’按哈希算法算出来一个数组下标,然后可以直接从数据中取出数据并拿到锁对应那一行数据的地址,进而查询那一行数据。此时查询效率还是蛮高的。
那么如果现在执行下面的sql语句:

select * from sanguo where name>‘周瑜’;

则无能为力,因为哈希表的特点就是可以快速的精确查询,但是不支持范围查询

2、如果用完全平衡二叉树呢

image.png

图中的每一个节点实际上应该有四部分:
左指针,指向左子树
键值
键值所对应的数据的存储地址
右指针,指向右子树
另外需要提醒的是,二叉树是有顺序的,简单的说就是“左边的小于右边的”假如我们现在来查找‘周瑜’,需要找2次(第一次曹操,第二次周瑜),比哈希表要多一次。而且由于完全平衡二叉树是有序的,所以也是支持范围查找的。

3、如果用完全平衡二叉树呢?

image.png

可以发现同样的元素,B树的表示要比完全平衡二叉树要“矮”,原因在于B树中的一个节点可以存储多个元素。

4、如果用B+树呢?

image.png

我们可以发现同样的元素,B+树的表示要比B树要“胖”,原因在于B+树中的非叶子节点会冗余一份在叶子节点中,并且叶子节点之间用指针相连。

5、那么B+树到底有什么优势呢?

这里我们用“反证法”,假如我们现在就用完全平衡二叉树作为索引的数据结构,我们来看一下有什么不妥的地方。实际上,索引也是很“大”的,因为索引也是存储元素的,我们的一个表的数据行数越多,那么对应的索引文件其实也是会很大的,实际上也是需要存储在磁盘中的,而不能全部都放在内存中,所以我们在考虑选用哪种数据结构时,我们可以换一个角度思考,哪个数据结构更适合从磁盘中读取数据,或者哪个数据结构能够提高磁盘的IO效率。回头看一下完全平衡二叉树,当我们需要查询“张飞”时,需要以下步骤

从磁盘中取出“曹操”到内存,CPU从内存取出数据进行笔记,“张飞”<“曹操”,取左子树(产生了一次磁盘IO)
从磁盘中取出“周瑜”到内存,CPU从内存取出数据进行笔记,“张飞”>“周瑜”,取右子树(产生了一次磁盘IO)
从磁盘中取出“孙权”到内存,CPU从内存取出数据进行笔记,“张飞”>“孙权”,取右子树(产生了一次磁盘IO)
从磁盘中取出“黄忠”到内存,CPU从内存取出数据进行笔记,“张飞”=“张飞”,找到结果(产生了一次磁盘IO)
同理,回头看一下B树,我们发现只发送三次磁盘IO就可以找到“张飞”了,这就是B树的优点:一个节点可以存储多个元素,相对于完全平衡二叉树所以整棵树的高度就降低了,磁盘IO效率提高了。

而B+树是B树的升级版,只是把非叶子节点冗余一下,这么做的好处是为了提高范围查找的效率。
到这里可以总结出来,Mysql选用B+树这种数据结构作为索引,可以提高查询索引时的磁盘IO效率,并且可以提高范围查询的效率,并且B+树里的元素也是有序的。

总结

1、它的关键字的数量是跟路数相等的;

2、B+Tree 的根节点和枝节点中都不会存储数据,只有叶子节点才存储数据。
目前的认知:我们这要存放的数据是什么?是不是真实数据的地址?
搜索到关键字不会直接返回,会到最后一层的叶子节点。比如我们搜索 id=28,虽
然在第一层直接命中了,但是数据地址在叶子节点上面,所以我还要继续往下搜索,一
直到叶子节点。

3、B+Tree 的每个叶子节点增加了一个指向相邻叶子节点的指针,它的最后一个数
据会指向下一个叶子节点的第一个数据,形成了一个有序链表的结构。


优点:

1)它是 B Tree 的变种,B Tree 能解决的问题,它都能解决。B Tree 解决的两大问题是(每个节点存储更多关键字;路数更多)

2)扫库、扫表能力更强(如果我们要对表进行全表扫描,只需要遍历叶子节点就可以了,不需要遍历整棵 B+Tree 拿到所有的数据)

3) B+Tree 的磁盘读写能力相对于 B Tree 来说更强,同数据量下磁盘I/0次数更少(根节点和枝节点不保存数据区,所以一个节点可以保存更多的关键字,一次磁盘加载的关键字更多)

4)范围查询和排序能力更强(因为叶子节点上有下一个数据区的指针,数据形成了链表)

5)效率更加稳定(B+Tree 永远是在叶子节点拿到数据,所以 IO 次数是稳定的)

相关文章

  • mysqI索引结构,特点,为什么使用这个

    why 为什么哈希表、完全平衡二叉树、B树、B+树都可以优化查询,为何Mysql独独喜欢B+树? 1、哈希表有什么...

  • MySQL --- 2021-11-02

    MySQL 索引使用什么数据结构?为什么用 B + 做索引?使用 B + 树。 这个问题,你可以在脑子里面先思考一...

  • MySQL性能优化(三)-- 索引

    一、什么是索引及索引的特点 索引是一种数据结构 索引的特点:查找速度快,排好序,数据结构 索引的数据结构类型有:B...

  • MySQL索引数据结构

    索引的本质 索引是什么:索引是一种帮助MySQL高效获取数据的有序数据结构 索引数据结构的选择 为什么使用索引? ...

  • MySQL高频面试

    1.MySQL 索引使用什么数据结构?为什么用 B+做索引? 使用B+树。这个问题,可以在脑子里面先思考一下,如果...

  • php+docker+swoole+rabbitmQ

    目录结构如下 项目地址:/data/php-nginx-compose php-mysqi Dockerfile文...

  • MySQL实战 | 05 如何设计高性能的索引?

    原文链接:MySQL | 05 如何设计高性能的索引? 上回我们主要研究了为什么使用索引,以及索引的数据结构。今天...

  • MySQL 性能优化 : 索引和查询优化

    前言 要知道为什么使用索引,要知道如何去使用好索引,使自己的查询达到最优性能,需要先了解索引的数据结构和磁盘的存取...

  • Mysql的原理解析

    文章目录 一、mysql数据结构 二、mysql 三层架构 三、聚集索引和非聚集索引 四、为什么使用索引可以提高查...

  • 索引

    sql执行过程 InnoDB索引结构/方法1.hash特点:key-value形式的索引结构优点:速度快、时间复杂...

网友评论

      本文标题:mysqI索引结构,特点,为什么使用这个

      本文链接:https://www.haomeiwen.com/subject/gcwqoltx.html