B+ 树

作者: Sun东辉 | 来源:发表于2022-07-12 11:12 被阅读0次

    B+ 树是一种树数据结构,通常用于数据库和操作系统的文件系统中。B+ 树的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度。B+ 树元素自底向上插入,这与二叉树恰好相反。

    B+ 树在节点访问时间远远超过节点内部访问时间的时候,比可作为替代的实现有着实在的优势。这通常在多数节点在次级存储比如硬盘中的时候出现。通过最大化在每个内部节点内的子节点的数目减少树的高度,平衡操作不经常发生,而且效率增加了。这种价值得以确立通常需要每个节点在次级存储中占据完整的磁盘块或近似的大小。
    B+ 背后的想法是内部节点可以有在预定范围内的可变量目的子节点。因此,B+ 树不需要像其他自平衡二叉查找树那样经常的重新平衡。对于特定的实现在子节点数目上的低和高边界是固定的。例如,在 2-3 B 树(常简称为2-3 树)中,每个内部节点只可能有 2 或 3 个子节点。如果节点有无效数目的子节点则被当作处于违规状态。

    总的来说,B+ 树是 B 树的一个变种,在内部节点中存储的键值同样也会出现在叶节点中,但内部节点中不存储关联附属数据或指针。在叶节点中的不仅存储键值,还存储关联附属数据或指针。相比于 B 树,有两个优点:

    • 只将键值和子女指针保存在了内节点中,所有的附属数据都保存在了叶节点中。由于内部节点不存储键值关联的附属数据,所以内部节点节省的空间可以存放更多的键值。也就意味着从磁盘存取一页时可获得更多的键值信息。
    • 叶节点还增加了一个指向下一个顺序关联叶节点的指针,形成了一个链,对树的全扫描就是对所有叶节点的线性遍历。


    B+ 树的操作

    查找

    查找以典型的方式进行,类似于二叉查找树。起始于根节点,自顶向下遍历树,选择其分离值在要查找值的任意一边的子指针。在节点内部典型的使用是二分查找来确定这个位置。

    插入

    1. 首先,查找要插入其中的节点的位置。接着把值插入这个节点中。
    2. 如果没有节点处于违规状态则处理结束。
    3. 如果某个节点有过多元素,则把它分裂为两个节点,每个都有最小数目的元素。在树上递归向上继续这个处理直到到达根节点,如果根节点被分裂,则创建一个新根节点。为了使它工作,元素的最小和最大数目典型的必须选择为使最小数不小于最大数的一半。

    删除

    1. 首先,查找要删除的值。接着从包含它的节点中删除这个值。
    2. 如果没有节点处于违规状态则处理结束。
    3. 如果节点处于违规状态则有两种可能情况:
      1. 它的兄弟节点,就是同一个父节点的子节点,可以把一个或多个它的子节点转移到当前节点,而把它返回为合法状态。如果是这样,在更改父节点和两个兄弟节点的分离值之后处理结束。
      2. 它的兄弟节点由于处在低边界上而没有额外的子节点。在这种情况下把两个兄弟节点合并到一个单一的节点中,而且我们递归到父节点上,因为它被删除了一个子节点。持续这个处理直到当前节点是合法状态或者到达根节点,在其上根节点的子节点被合并而且合并后的节点成为新的根节点。

    B+ 树的操作和 B 树类似,只是由于数据结构的不同,略微有一些变化,就请大家自行思考吧。

    相关文章

      网友评论

          本文标题:B+ 树

          本文链接:https://www.haomeiwen.com/subject/hxdnbrtx.html