leetcode 215. 数组中的第K个最大元素（热门面试题）

作者: M_lear | 来源:发表于2020-03-26 00:10 被阅读0次

LeetCode 215. 数组中的第K个最大元素
算法分析 [最大/小值] 2019-02-28
LeetCodeDay57 —— 数组中的第K个最大元素★☆
LeetCode 第 215 题：在未排序的数组中找到第 k 个
LeetCode 215 数组中的第K个最大元素
LeetCode热门100题算法和思路（day7）
leetcode算法记录
Golang 排序
解决TopK
LeetCode-215-数组中的第K个最大元素

一、题目

在未排序的数组中找到第 k 个最大的元素。请注意，你需要找的是数组排序后的第 k 个最大的元素，而不是第 k 个不同的元素。

示例 1:

输入: [3,2,1,5,6,4] 和 k = 2
输出: 5

示例 2:

输入: [3,2,3,1,2,4,5,5,6] 和 k = 4
输出: 4

说明:
你可以假设 k 总是有效的，且 1 ≤ k ≤ 数组的长度。

二、求解

解法一：快速选择算法

跟快速排序是一个人发明的，思想和快速排序一样，平均时间复杂度为 $O(n)$ 。
第一次是 $O(n)$ ，第二次是 $O(n/2)$ ，第三次是 $O(n/4)$ ... 第 $n$ 次是 $O(n/n)$ ，总时间复杂度就是 $O(n + n/2 + n/4....+1) = O(2n-1) = O(n)$ 。

class Solution {
    private int[] nums;
    private int k;
    
    public int findKthLargest(int[] nums, int k) {
        this.nums = nums;
        this.k = k;
        return quickSelect(0, nums.length-1);
    }
    
    private int quickSelect(int start, int end){
        int random = start + (int)(Math.random()*(end-start+1));
        int pivot = nums[random];
        nums[random] = nums[start];
        int i = start, j = end;
        while(i < j){
            while(i < j && nums[j] <= pivot) --j;
            nums[i] = nums[j];
            while(i < j && nums[i] >= pivot) ++i;
            nums[j] = nums[i];
        }
        if(i == k-1) return pivot;
        nums[i] = pivot;
        if(i > k-1) return quickSelect(start, i-1);
        else return quickSelect(i+1, end);
    }
}

从测试用例的运行结果来看，随机选择枢轴确实要比固定选择快得多。

知识点补充：java 生成随机数

记住两种：

Math.random()，返回值为 double，范围在 [0, 1)。
new Random().nextInt(n)，生成范围在 [0, n) 的一个整数。

Math.random() 源码：

Math.random() 的设计采用了单例模式（不是严格的单例模式，这里指从 Math.random() 这个入口进，只会实例化一个 Random 对象，并不是 Random 只能实例化一个对象）。
random() 是 java.lang.Math 中的一个静态函数：

public static double random() {
    return RandomNumberGeneratorHolder.randomNumberGenerator.nextDouble();
}

Math$RandomNumberGeneratorHolder.class

private static final class RandomNumberGeneratorHolder {
    static final Random randomNumberGenerator = new Random();
}

很明显是一个静态内部类写法的单例模式。
最后用的还是 java.util.Random 这个类的对象。

public double nextDouble() {
    return (((long)(next(26)) << 27) + next(27)) * DOUBLE_UNIT;
}

protected int next(int bits) {
    long oldseed, nextseed;
    AtomicLong seed = this.seed;
    do {
        oldseed = seed.get();
        nextseed = (oldseed * multiplier + addend) & mask;
    } while (!seed.compareAndSet(oldseed, nextseed));
    return (int)(nextseed >>> (48 - bits));
}

最终的 next 函数使用了 CAS 乐观锁机制。

new Random().nextInt(n) 源码：

public int nextInt(int bound) {
    if (bound <= 0)
        throw new IllegalArgumentException(BadBound);

    int r = next(31);
    int m = bound - 1;
    if ((bound & m) == 0)  // i.e., bound is a power of 2
        r = (int)((bound * (long)r) >> 31);
    else {
        for (int u = r;
             u - (r = u % bound) + m < 0;
             u = next(31))
            ;
    }
    return r;
}

protected int next(int bits) {
    long oldseed, nextseed;
    AtomicLong seed = this.seed;
    do {
        oldseed = seed.get();
        nextseed = (oldseed * multiplier + addend) & mask;
    } while (!seed.compareAndSet(oldseed, nextseed));
    return (int)(nextseed >>> (48 - bits));
}

两种方式最后调用的都是 next 方法。

解法二：小根堆

class Solution {
    public int findKthLargest(int[] nums, int k) {
        // 小根堆，采样自下而上的建堆方式
        for(int i = k/2-1; i >= 0; --i){
            siftDown(nums, i, k);
        }
        for(int i = k; i < nums.length; ++i){
            if(nums[i] <= nums[0]) continue;
            nums[0] = nums[i];
            siftDown(nums, 0, k);
        }
        return nums[0];
    }

    private void siftDown(int[] nums, int i, int len){
        int e = nums[i];
        int half = len >> 1;
        while(i < half){
            // 先令 child 指向 i 的左孩子
            int child = (i << 1) + 1;
            // 如果 i 的右孩子更小，令 child 指向右孩子
            if(child+1 < len && nums[child+1] < nums[child]) ++child;
            // 如果两个孩子都大于 e，直接跳出
            if(e <= nums[child]) break;
            nums[i] = nums[child];
            i = child;
        }
        nums[i] = e;
    }
}

时间复杂度分析，自下而上建了一个含有 $k$ 个元素的堆，时间复杂度为 $O(k)$ ，后面对这个堆最多调整 $n-k$ 次，时间复杂度为 $O((n-k)\log k)$ ，所以整体的时间复杂度为 $O(n\log k)$ 。

解法三：大根堆

class Solution {
    public int findKthLargest(int[] nums, int k) {
        // 大根堆，采用自上而下的建堆方式
        for(int i = 1; i < nums.length; ++i){
            siftUp(nums, i);
        }
        for(int i = 1; i < k; ++i){
            nums[0] = nums[nums.length-i];
            siftDown(nums, 0, nums.length-i);
        }
        return nums[0];
    }

    private void siftUp(int[] nums, int i){
        int e = nums[i];
        while(i > 0){
            int parent = (i-1) >> 1;
            if(e <= nums[parent]) break;
            nums[i] = nums[parent];
            i = parent;
        }
        nums[i] = e;
    }

    private void siftDown(int[] nums, int i, int len){
        int e = nums[i];
        int half = len >> 1;
        while(i < half){
            int child = (i << 1) + 1;
            if(child+1 < len && nums[child+1] > nums[child]) ++child;
            if(e >= nums[child]) break;
            nums[i] = nums[child];
            i = child;
        }
        nums[i] = e;
    }
}

知识点补充：1. 自下而上建堆

适用于所有堆元素已知的情况，一般也是这样。
会用到向下调整的操作（siftDown）。
向下调整函数常见的函数名：heapAdjust，adjustHeap，heapify，siftDown

public void buildHeap(int[] nums){
    for(int i = nums.length/2-1; i >= 0; --i){
        siftDown(nums, i, nums.length);
    }
}

/**
 * @param nums 层次遍历表示的完全二叉树的堆数组
 * @param i 要向下调整的结点位置
 * @param len 堆大小
 */
private void siftDown(int[] nums, int i, int len){
    int e = nums[i];
    int half = len >> 1;
    while(i < half){
        // 先令 child 指向 i 的左孩子
        int child = (i << 1) + 1;
        // 如果 i 的右孩子更小，令 child 指向右孩子
        if(child+1 < len && nums[child+1] < nums[child]) ++child;
        // 如果两个孩子都大于 e，直接跳出
        if(e <= nums[child]) break;
        nums[i] = nums[child];
        i = child;
    }
    nums[i] = e;
}

为什么从 nums.length/2-1 开始，它为什么是第一个非叶结点的下标？
一般数组下标为 0 的位置也是堆的一部分，则下标为 i 的左右子结点分别为 2*i+1 和 2*i+2（想不起来时，想三个结点的情况 [0, 1, 2]（层次遍历表示））。
而严蔚敏版数据结构书上，堆的起始位置是 1，所以下标为 i 的左右子结点分别为 2*i 和 2*i+1。

这里的 nums.length 是堆大小，所以最后一个叶结点的下标为 nums.length-1。
找第一个非叶结点就是找最后一个叶结点的父结点。
我们用 $k$ 表示堆大小，则最后一个叶结点的下标为 $k-1$ 。
令 $2*i+1=k-1$ ，此时叶结点为左子结点，所以 $i=k/2-1$ 。
令 $2*i+2=k-1$ ，此时叶结点为右子结点，所以 $k$ 一定为奇数，首先有 $\lfloor k/2\rfloor =(k-1)/2$ ，所以 $i=(k-3)/2=(k-1)/2-1=\lfloor k/2\rfloor-1$ 。
由于 java 的整数除法是自动向下取整的，所以第一个非叶结点下标为 nums.length/2-1。

自下而上建堆的时间复杂度：参见严蔚敏教材，结论为 $O(n)$ 。

2. 自上而下建堆（插入建堆）

适用于动态添加堆元素的情况。

public void buildHeap(int[] nums){
    for(int i = 0; i < nums.length; ++i){
        siftUp(nums, i);
    }
}

/**
 * @param nums 堆数组，[0, i) 部分已经堆化
 * @param i 待插入元素的位置
 */
public void siftUp(int[] nums, int i){
    int e = nums[i];
    while(i > 0){
        int parent = (i-1) >> 1;
        if(nums[parent] <= e) break;
        nums[i] = nums[parent];
        i = parent;
    }
    nums[i] = e;
}

插入建堆的时间复杂度为 $O(n\log n)$ 。

LeetCode 215. 数组中的第K个最大元素
LeetCode 215. 数组中的第K个最大元素题目描述：代码：
算法分析 [最大/小值] 2019-02-28
1. 数组，查找第k大值 215. 数组中的第K个最大元素（元素不重复无序） Kth Largest Elemen...
LeetCodeDay57 —— 数组中的第K个最大元素★☆
215. 数组中的第K个最大元素描述在未排序的数组中找到第 k 个最大的元素。请注意，你需要找的是数组排序后的...
LeetCode 第 215 题：在未排序的数组中找到第 k 个
传送门：215. 数组中的第K个最大元素。在未排序的数组中找到第 k 个最大的元素。请注意，你需要找的是数组排序...
LeetCode 215 数组中的第K个最大元素
215. 数组中的第K个最大元素这道题是找到数组中的第K个最大元素，里面有个陷阱就是惯性思维，一开始只简单的认为...
LeetCode热门100题算法和思路（day7）
LeetCode215 数组中的第k个最大元素题目详情给定整数数组 nums 和整数 k，请返回数组中第 k ...
leetcode算法记录
数组中的第K个最大元素[https://leetcode-cn.com/explore/interview/car...
Golang 排序
215. 数组中的第K个最大元素 1、使用sort源码 2、冒泡排序 3、选择排序对比n后面所有数，将最大的和n...
解决TopK
前言 TopK问题有以下几种常见形式数组中的第K个最大元素动态添加的数组中的第K个最大元素数组中前k个最大的元素...
LeetCode-215-数组中的第K个最大元素
数组中的第K个最大元素题目描述：给定整数数组 nums 和整数 k，请返回数组中第 **k** 个最大的元素。请...