堆排序

作者: 我是才子 | 来源:发表于2018-09-15 00:07 被阅读4次

    一些基础知识

    学习堆排序,总要了解的数据结构吧,了解堆又需要了解二叉树的基本知识,了解二叉树要先知道树是个什么东西吧…… 呃,还是太年轻。这里简单谈谈吧。

    二叉树

    1. 提一下——是一对多的数据结构,从一个根结点开始,生长出它的子结点,而每一个子结点又生长出各自的子结点,成为子树。如果某个结点不再生长出子结点了,它就成为叶子

      一个普通的树结构
    2. 二叉树是每个节点最多有两个子树()的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree),且次序不能颠倒。

      二叉树
    3. 完全二叉树除最后一层外,若其余层都是满的,并且最后一层或者是满的,或者是在右边缺少连续若干节点。

      完全二叉树
    1. 满二叉树的所有分支结点都既有左子树又有右子树,并且所有叶子都在同一层。每一层上的节点数都是最大节点数 。

      满二叉树

    堆排序

    1. 数组与堆结构 (如何用数组实现):

      image

      对于任一节点(若其在数组中对应元素下标为 i)而言,都有

      • 子节点:左孩子是2*i+1,右孩子是2*i+2
      • 父节点:(i - 1) / 2
    2. 生成大根堆:

      堆可以分为大根堆和小根堆。在大根堆中,所有子树中子节点的值都小于等于父节点;而小根堆的组织方式恰好相反:所有子树中子节点的值都大于等于父节点。在堆排序中,使用的是大根堆;而小根堆常被用作构建优先队列

      调整大根堆的过程,遍历数组元素,将当前节点与其父节点进行比较:

      • 若当前节点小于等于父节点,则比较下一位置。
      • 若当前节点大于父节点,则将当前节点与父节点交换,然后比较交换后的父节点(交换前的“当前”节点)与其父节点进行比较(交换)过程。这个过程很明显可以是个递归过程。

      下面是该过程的实现:

            /**
              * 递归调整大根堆
              * @param arr array
              * @param index current node index
              * @param comparable 比较原则
              */
            private void heapInsert(T[] arr, int index, Comparator<T> comparable) {
                int parent = (index - 1) >>> 1;
                if (comparable.compare(arr[index], arr[parent]) <= 0) {
                    return;
                }
      
                swap(arr, index, parent);
                heapInsert(arr, parent, comparable);
            }
      
            /**
              * 非递归调整大根堆
              */
            private void heapInsertByLoop(T[] arr, int index, MangoComparable<T> comparable) {
                int parent = (index - 1) / 2;
                while (comparable.compare(arr[index], arr[parent]) > 0) {
                    swap(arr, index, parent);
                    index = parent;
                    parent = (index - 1) / 2;
                }
            }
      
    3. 容易想到的是,调整完毕后的树仍然是无序的。但是可以理解的是根节点一定是整个树(数组)的最大值,那么我们完全可以利用上述过程查找最大值,然后将与树的最后一个节点交换。再对除最后一个节点的前n-1个树节点(将树的规模缩小1,size--)进行大根堆调整,再交换。循环执行此过程,即可使得元素升序排列。

    值得注意的是,大根堆生成过程中的调整策略,是将当前元素与父节点比较(由底向上),利用该策略同样可以完成上述排序过程,流程如下:(构建大根堆 -> 交换)

    image

    具体实现如下:

    
        @Override
        public void sort(T[] array, Comparator<T> comparable) {
            if (array == null || array.length < 2) {
                return;
            }
    
            for (int i = 0; i < array.length; i++) {
                heapInsert(array, i, comparable);
            }
    
            int heapSize = array.length;
            swap(array, 0, --heapSize);
    
            while (heapSize > 0) {
                for (int i = 0; i < heapSize; i++) {
                    heapInsert(array, i, comparable);
                }
                swap(array, 0, --heapSize);
            }
        }
    

    而在排序过程中,我们当然也可以便利地比较左右子树与父节点即,当前节点(由顶向下,毕竟此时我们已经生成了堆结构了)。找到当前节点的左右节点中较大的子节点,与当前节点比较:

    • 若当前节点大于等于较大的子节点,则判断下一个节点。
    • 若当前节点小于较大的子节点,则将当前节点与较大的节点交换(我们的目标是让最大值向上浮)。然后比较交换后的所产生的父节点(交换前的较大的子节点)与其子节点进行比较(交换)。

    具体流程如下:

    image

    具体实现如下:

     @Override
        public void sort(T[] array, Comparator<T> comparable) {
            // ...
            while (heapSize > 0) {
                heapify(array, 0, heapSize, comparable);
            }
        }
    
        /**
         * 递归版
         */
        private void heapify(T[] arr, int index, int size, Comparator<T> comparable) {
            int left = 2*index + 1;
            if (left < size) {
                int largestChild = left + 1 < size 
                    && comparable.compare(arr[left+1], arr[left]) > 0 ? left+1 : left;
                if (comparable.compare(arr[largestChild], arr[index]) < 0) {
                    return;
                }
    
                swap(arr, largestChild, index);
                heapify(arr, largestChild, size, comparable);
            }
        }
    
     /**
         * 非递归版
         */
       private void heapifyByLoop(T[] arr, int index, int size, Comparator<T> comparable) {
            int left = 2*index + 1;
            while (left < size) {
                int largestChild = left + 1 < size 
                    && comparable.compare(arr[left+1], arr[left]) > 0 ? left+1 : left;
                if (comparable.compare(arr[largestChild], arr[index]) < 0) {
                    return;
                }
    
                swap(arr, largestChild, index);
                index = largestChild;
                left = 2*index + 1;
            }
        }
    
    1. 时间复杂度分析:我们知道二叉树结构的基础操作时间复杂度为O(logN),其中N是树的节点数。大根堆的生成过程相当于不断向树中增加节点的过程,即

      数组中下标为0的元素,插入高度为0的二叉树;
      数组中下标为1的元素,插入高度为1的二叉树;
      数组中下标为2的元素,插入高度为2的二叉树;
      ……
      数组中下标为n-1的元素,插入高度为n-1的二叉树;
      

      所以,该操作时间复杂度为O(log1 + log2 + ... + logi + ... + logn) = O(logn!),经数学证明(logn!nlogn "同阶函数"),因此生成大根堆的时间复杂度是O(nlogn)

    相关文章

      网友评论

        本文标题:堆排序

        本文链接:https://www.haomeiwen.com/subject/glxzgftx.html