美文网首页
堆(heap)

堆(heap)

作者: 币来币往 | 来源:发表于2018-12-13 17:19 被阅读0次

    什么是堆? 堆是满足下面两个条件的一种二叉树

    • 它是一棵完全二叉树;
    • 堆中每个节点的值都必须大于等于(大根堆)或者小于等于(小根堆)其子树中每个节点的值。
      完全二叉树是指除了最后一层,其他层的节点个数都是满的,最后一层的节点都靠左排列
      我们看几个例图
      image.png
      其中1,2是大根堆,3,4是小根堆。从图中我们也可以看出来,同一组数据排成的堆可能有多种形式。

    存储

    因为堆是一棵完全二叉树,所以我们通常使用数组来存储它。节约空间也好定位父节点或者子节点。为了计算子节点方便,通常从下标为1的位置开始存储,如果i是父节点那么2i, 2i + 1就是子节点。
    如下图所示

    image.png

    添加元素

    添加元素通常是在数组的最末尾添加,这样添加之后数组仍然满足堆的特性1,但是不满足特性2了,所以必须进行调整,我们将这个调整过程称为heapify.
    方法很简单: 就是顺着节点所在的路径,往上对比,需要换位置的就交换


    image.png

    下面是java代码实现:

    public void insert(int value){
            if(count >= capacity) return ;
            data[++count] = value;
            int current = count;
            int parentIndex = count/2;
            while(parentIndex > 0 && data[parentIndex] < value){
                data[current] = data[parentIndex];
                data[parentIndex] = value;
                current = parentIndex;
                parentIndex = current/2;
            }
        }
    

    删除堆顶元素

    删除堆顶元素的方法是,将堆顶元素删除,然后将最后一个元素放到堆顶,这样就保证了特性1,然后再按住从上往下的顺序比较交换元素,以满足特性2


    image.png

    java代码实现

    public void removeMax(){
            if(count <= 0) return;
            data[1] = data[count--];
            int current = 1;
            while(true){
                int maxIndex = current;
                if(current *2 <= count && data[current *2] > data[maxIndex]) {
                    maxIndex = current * 2;
                }
                if(current *2 + 1 <= count && data[current * 2 + 1] > data[maxIndex]) {
                    maxIndex = current * 2 + 1;
                }
                if(maxIndex == current) break;
                int temp = data[current];
                data[current] = data[maxIndex];
                data[maxIndex] = temp;
                current = maxIndex;
            }
        }
    

    有了上述了解之后,接下来我们看看堆最重要的一个应用,堆排序
    堆排序可以分成两步:
    1. 建堆
    我们先来分析一下原始数据,刚开始数据是无序的,但其中叶子节点其实已经是“有序”的了,即其满足堆的定义,大于它所有的子节点,因为它们没有子节点;所有我们只需要对非叶子节点进行排序即可,这里可以宣传从上往下heapify的方法来建堆

    image.png
    java代码实现如下:
    public static void buildHeap(int[] array, int n){
            if(array == null || array.length < 2) return;
            for(int i = n/2; i >= 1; i--){
                heapify(array, n, i);
            }
        }
    
        private static void heapify(int[] array, int n, int i) {
            while(true){
                int maxIndex = i;
                if(i * 2 <= n && array[i*2] > array[maxIndex]) {
                    maxIndex = i * 2;
                }
                if(i*2 + 1 <= n && array[i*2+1] > array[maxIndex]){
                    maxIndex = i * 2 + 1;
                }
                if(maxIndex == i) break;
                swap(array, i, maxIndex);
                i = maxIndex;
            }
        }
    
        private static void swap(int[] array, int i, int maxIndex) {
            int temp = array[i];
            array[i] = array[maxIndex];
            array[maxIndex] = temp;
        }
    

    2. 排序
    堆建成之后,我们能确定的是第一个元素就是最大元素了(或者最小元素),其他元素的顺序无法确定,所以我们此时将第一个元素和最好一个个元素互换,堆大小减一,此时给我没删除操作类似了,只需要再次堆话就可以得到第二大数据,依次类推可以对整个数组排序

    image.png
    java 代码实现
     public static void sort(int[] array, int n){
            buildHeap(array, n);
            if(array == null || array.length < 2) return;
            while(n > 1){
                swap(array, 1, n--);
                heapify(array, n, 1);
            }
        }
    

    堆的应用场景

    • 优先级队列
      java 中的PriorityQueue 就是用堆实现的
    • 取数组中TopK的数据
      假如我们要取一组数据中的top 5,那么我们只需要维护一个5个元素大小的小根堆,当有数据加进来时只需要和堆顶元素做比较,如果比堆顶元素小直接忽略,如果比堆顶元素大,则置换调堆顶元素,然后做heapify.这样每次加数据都只需要和堆顶元素做比较
    • 利用堆求中位数
      对应静态数据我们可以直接用快排找;对于动态变化的数据,用堆就比较合适了,这里需要维护两个堆,一个大根堆,一个小根堆;大根堆里面存储前一半小数据,小根堆里面存储后一半大数据。每次插入数据的时候和大根堆堆顶元素比较,小于则放入大根堆,大于则放入小根堆,放完之后为了保证大根堆的堆顶就是中位数,我们可能需要在两个堆之间移动一下数据;


      image.png

    相关文章

      网友评论

          本文标题:堆(heap)

          本文链接:https://www.haomeiwen.com/subject/nryvhqtx.html