美文网首页数据结构与算法
红黑树01——前传-二叉搜索树.md

红黑树01——前传-二叉搜索树.md

作者: readyou | 来源:发表于2019-02-15 13:51 被阅读16次

    0. 树与查找

    一棵有n个结点的平衡二叉树的高度为O(lg(n)),即使查找到叶子结点,花的时间为O(lg(n)),远胜过O(n),所以树在需要搜索优化的地方用得比较多。而我们的二叉搜索树呢,顾名思义,就是用来做搜索用的,本文将讲述它的原理。

    另外树如果不平衡,则容易退化成链表,所以我们要想办法让树保持平衡。红黑树,就是其中一种非常高效,应用范围极广的一种类平衡树(为了优化性能,它并不要求绝对平衡)。本文集将详细讲述红黑树的原理以及代码实现。

    1. 二叉搜索树的定义

    二叉搜索树又叫二叉排序数,如果树不为空的话,对树上的任意一个结点x,具有如下性质:

    1. 如果x的左子树存在的话,则x左子树上所有的结点的值都小于x;
    2. 如果x的右子树存在的话,则x右子树上所有的结点的值都大于x。

    Tips: 二叉搜索树不允许有重复值。拿我们常用的Map来说,如果插入重复的值,要么覆盖原来的值,要么插入失败。

    本文中所提到的树默认都是二叉搜索树,设根为root,对结点x,它的左结点用x.left表示,右结点用x.right表示,父结点用x.parent表示。为了便于说明,对结点x,我们记它左结点为L, 右结点为R,父结点为P,祖父结点为PP,x附带的数据为x.data

    图1-二叉搜索树

    下面举例都针对:图1-二叉搜索树。建议把该图下下来查看,免得频繁找图来回切换。

    2. 子树的最小结点与最大结点

    对以x为根的子树:

    • 最小值:为该树最左边的结点,即从L开始一路往左下方搜索;如果L不存在,则最小值即为x。如:找以结点3为根的子树的最小值,从1(L)开始,沿左下方搜索,直到0;结点13为根的子树,因为没有左结点,所以最小值即为13本身。
    • 最大值:跟最小值对称,这里不做进一步说明。
        private Node min(Node node) {
            while (node.left != null) {
                node = node.left;
            }
            return node;
        }
    
        private Node max(Node node) {
            while (node.right != null) {
                node = node.right;
            }
            return node;
        }
    
    

    3. 树结点的前驱与后继

    3.1 前驱

    结点的前驱是比它小的结点里面最大的结点。

    • 若L存在,则x的前驱为x左子树最大的结点(即L开始一路往右下方搜索)。如:7的前驱为6(从7的左结点3开始一路往右),1的前驱为0(从0开始一路往右,因为右边没有了,所以停止在0的地方);
    • 若L不存在:
      1. 如果P.right == x,则P < x,又因为P大于P左子树里面的全部结点的值,所以P就是x的前驱,如:结点14的前驱为13。
      2. 否则,x的前驱为P的前驱,x指向P继续查找,如:结点11,P.right != x,故设x = 12继续查找。因为对12有P.right == x,所以10即为12的前驱,所以11的前驱为10。
        public Node predecessor(Node node) {
            if (node.left != null) {
                return min(node.left);
            }
            Node p = node.parent;
            while (p != null && p.left == node) {
                node = p;
                p = p.parent;
            }
            return p;
        }
    

    3.2 后继

    后继是比它大的结点里面最小的结点。跟前驱对称,这里不做进一步的说明。记住一个现象,就是x左右子树都存在时,x的后继没有左结点(后继.left == null)。这一点在后面将会用到,有助于理解代码。

        public Node successor(Node node) {
            if (node.right != null) {
                return min(node.right);
            }
            Node p = node.parent;
            while (p != null && p.right == node) {
                node = p;
                p = p.parent;
            }
            return p;
        }
    

    3.3 前驱与后继示例

    大家可以试着随便从上面的树上找一个结点,然后按上面的规则找一下它的前驱与后继(注意:不要从数字上直接得到答案,因为上面这棵树是从0到15的排序数,所以前驱-结点-后继就是3个连续的数。但反过来,可以用这个结论来验证你的答案是否正确)。

    • 结点1的前驱为0,后继为2;
    • 结点3的前驱为2,后继为4;
    • 结点7的前驱为6,后继为8;
    • 结点10的前驱为9,后继为11;
    • 结点9只有前驱8,后继为10;

    3.4 快速构造一个树,帮助回想起前驱后继的全部逻辑

    写代码的时候,如果万一忘记了前驱与后继的逻辑,3-1-5-2-4这样,前5个自然数构成的以3为根对称分布的树,能快速帮助回忆起相关细节来。

    图2-前驱与后继

    4. 数据的查找

    搜索的算法比较简单,从根开始依次比较,设当前结点为x,待查找的数据为data,如果x.data == data,则找到了,返回结果;如果data < x.data,则继续查找x.left,否则继续查找x.right

        public Node search(T data) {
            if (data == null) {
                return null;
            }
            Node node = root;
            while (node != null) {
                int compare = data.compareTo((T) node.data);
                if (compare == 0) {
                    return node;
                }
                if (compare < 0) {
                    node = node.left;
                } else {
                    node = node.right;
                }
            }
            return null;
        }
    

    5. 插入

    1. 如果root不存在,则将插入的结点设为根,插入结束;
    2. 否则,从根开始依次比较,设p为待插入结点的父结点,设当前结点为x,待插入的数据为data。若data < x.data,则需要插入到左边的某个位置:p = x; x = x.left,否则插入到右边的某个位置:p = x; x = x.right。当x == null时,将待插入的结点挂在p下面即可。
        public void insert(T data) {
            Node node = new Node();
            node.data = data;
            if (root == null) {
                root = node;
                return;
            }
            Node child = root;
            Node p = null;
            while (child != null) {
                p = child;
                if (data.compareTo((T) child.data) < 0) {
                    child = child.left;
                } else {
                    child = child.right;
                }
            }
            node.parent = p;
            if (data.compareTo((T) p.data) < 0) {
                p.left = node;
            } else {
                p.right = node;
            }
        }
    

    6. 删除

    1. 如果L不存在,则用R替代x即可;
    2. 如果R不存在,则用L替代x即可;
    3. 如果L与R都存在,我们需要找到最接近x的且比它大的结点来替代x(这结点不就是上文提到的后继嘛,不妨设该后继结点为s)。另外特别注意,x的左右结点还需要在原来的地方,所以按下面的逻辑来处理:
      • 处理左结点:根据上文提到的,s的左子树不存在,所以可放心地把x.left挂在s下面: s.left = x.left
      • 处理右结点:如果x.right == s,则s就是x的右结点,所以x.right不需要处理。
      • 否则,要想执行s.right = x.right,需要把s.right先腾出来。怎么腾呢?因为s移走了,所以s的位置需要让s的右结点替代(为什么是右结点?前方提到过,这种情况下s没有左结点,所以只能是右结点来替代。另外注意了,右结点可能为null),这时候s的右结点就顺便腾出来了。然后将x.right挂在s下面。
        public boolean delete(T data) {
            Node node = search(data);
            if (node == null) {
                return false;
            }
            if (node.left == null) {
                replace(node, node.right);
                return true;
            }
            if (node.right == null) {
                replace(node, node.left);
                return true;
            }
            Node successor = min(node.right);
    
            // 步骤3没有特定顺序,你可以试着随意变换顺序。
            // 3. 将node.left挂在successor下面。
            successor.left = node.left;
            node.left.parent = successor;
    
            // 1. 处理右结点:步骤1必需在步骤2前面进行,否则successor移动,下面的if判断的结果会变化。
            if (node.right != successor) {
                replace(successor, successor.right);
                node.right.parent = successor;
                successor.right = node.right;
            }
    
            // 2. 将successor替代node。
            replace(node, successor);
    
            return true;
        }
    
        // replace只是把新的结点挂在老结点的父结点下面,老结点脱离了父结点而处于游离状态。
        // 但新、老结点的左右孩子,都不在本方法中处理,请额外处理。
        private void replace(Node oldNode, Node newNode) {
            Node parent = oldNode.parent;
            if (parent == null) {
                root = newNode;
            } else {
                if (parent.left == oldNode) {
                    parent.left = newNode;
                } else {
                    parent.right = newNode;
                }
            }
            if (newNode != null) {
                newNode.parent = oldNode.parent;
            }
        }
    

    6.1 代码说明

    有结点变动的方法(插入、删除、替换),各指针要不重不漏。

    注意到原successor方法中

            if (node.right != null) {
                return min(node.right);
            }
    

    我们这里已经满足node.right != null,所以min(node.right)就是successor。

    另外注意结点替代顺序,先用s的右结点替代s把s.right空出来(此时s可以理解为游离状态,没有父结点),然后把x.right挂在s.right的地方,最后再把s替代x。

    源码

    https://github.com/readyou/algorithm-introduction-code/blob/master/src/main/java/me/wxl/demo/data/struct/BinarySearchTree.java

    作者微信

    wx.png

    转载声明

    如果您需要转载,请注明转载来源。

    相关文章

      网友评论

        本文标题:红黑树01——前传-二叉搜索树.md

        本文链接:https://www.haomeiwen.com/subject/edtpeqtx.html