美文网首页
求第k小系列(二):在两个排序好的数组中找第k小

求第k小系列(二):在两个排序好的数组中找第k小

作者: 吃啥呀 | 来源:发表于2020-05-07 11:07 被阅读0次

    第k小 二分法 c++

    题目描述:

    There are two sorted arrays nums1 and nums2 of size m and n respectively.

    Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

    You may assume nums1 and nums2 cannot be both empty.

    e.g.

    nums1 = [1, 2]
    nums2 = [3, 4]
    
    The median is (2 + 3)/2 = 2.5
    

    解题分析:

    假设待合并的两个数组为 A (size: m) 和 B (size:n),既然要求的时间复杂度是lg,一般是将数组分成两部分,即二分法,可以满足这种时间复杂度。

    1.这个中位数应当再哪里?

    将数组A分为 [0, i-1] 和 [i, m-1] 两部分(0 <= i <= m),数据B分为 [0, j-1] 和 [j, n-1] 两部分(0 <= j <= n)。

    将 left_A 和 left_B放入一个集合,并将 right_A 和 right_B 放入另一个集合。 再把这两个新的集合分别命名为
    left_part 和 right_part:

          left_part          |        right_part
    A[0], A[1], ..., A[i-1]  |  A[i], A[i+1], ..., A[m-1]
    B[0], B[1], ..., B[j-1]  |  B[j], B[j+1], ..., B[n-1]
    

    A有m+1种分法,B有n+1种分法

    在满足如下条件情况下(边界情况暂不考虑):

    max(left_part)≤min⁡(right_part) => A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ I ]

    • m+n 为偶数:len(left_part)=len(right_part) => i+j = m-i+n-j => i+j = (m+n+1)/2

    所求中位数为:median = (max(left_part)+min⁡(right_part))/2

    • m+n 为奇数:len(left_part)=len(right_part)+1 => i+j = m-i+n-j+1 => i+j = (m+n+1)/2

    所求中位数为:median = max(left_part)

    if ((size1 + size2) % 2 == 0) return (left + right) * 1.0 / 2;
    else return left;
    
    2.应当满足什么条件

    进一步分析条件:

    ① 0 ≤ j ≤ n;② j = (m+n+1)/2-i ;③ 0 ≤ i≤ m

    ②③ => ④ : n≥m(不过i取任何值,j 都不为负数)

    ①② => : 0 ≤ (m+n+1)/2-i ≤ n ,(m-n+1)/2 ≤ i;此条件在④条件下无意义

    所以我们需要找到 i 满足

    A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ i ] ,且 j = (m+n+1)/2-i ,n≥m

        // 1 对应的是长度较短的数组A
        // 2 对应的是长度较长的数组B
        int min1 = 0, max1 = 0;  // 长度较短的数组的最大最小值
        int size1, size2; // 记录下大小
        if (nums1.size() > nums2.size()) {
            // 如果1比2大,则交换数组
            vector<int> temp;
            temp.assign(nums2.begin(), nums2.end());
            nums2.assign(nums1.begin(), nums1.end());
            nums1.assign(temp.begin(), temp.end());
        }
        size1 = nums1.size();
        size2 = nums2.size();
    
        // max1不用size-1,因为插空分,是可以分到末尾的
        max1 = nums1.size();
    
        // 记录下两个数组二分的中间值
        int p1;
        int p2;
        // 根据二分获得中位数左边值,中位数右边值
        // 最后根据size1+size2的奇偶性判断median取值
        int left, right;
        while (min1 <= max1) {
            p1 = (min1 + max1) / 2;
            p2 = (size1 + size2 + 1) / 2 - p1;
            ...
        }
    
    
    3.如何二分搜索找到 i
    1. 设imin=0,imax=m,然后开始在[imin,imax]中进行搜索。

    2. i = (imin+imax)/2, j = (m+n+1)/2-i

    3. 遇到如下几种情况:

      • A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ I ]

        满足条件,直接根据m+n的奇偶性返回值

      • A[ i-1 ] > B[ j ]

        说明 A[ i-1 ] 太大了,需要将 i 减小,则搜索范围调整为[ imin, i−1 ],更新 imax 和 i

      • B[ j-1 ] > A[ I ]

        说明A[ i ] 太小了,需要将 i 增大,则搜索范围调整为[ i+1, imax ],更新 imin 和 i

            // 应当先调大小,可能存在临界值不满足大小关系
            if (p1 > 0 && nums1[p1 - 1] > nums2[p2]) {
                // 说明较短数组的中间值过大,应当调小
                max1 = p1 - 1;
            } else if (p1 < size1 && nums2[p2 - 1] > nums1[p1]) {
                // 说明较短数组的中间值过小,应当调大
                min1 = p1 + 1;
            } else {
                // 前两个情况均为临界值,先检查异常情况
                if (临界值) { 
                    .......
                } else {
                    // 在边界内
                    left = max(nums1[p1 - 1], nums2[p2 - 1]);
                    right = min(nums1[p1], nums2[p2]);
                    break;
                }
    
    
    4. 临界值分析

    当 i=0,i=m , j=0 , j=n 时会存在 i-1, i+1 越界的情况。

    我们先分析i和j是否会取到临界值:

    1. i=0时,A数组全部被分到右边, 可能存在j=n的临界值情况,
      需保证:B[j-1] ≤ A[I],
    i=0
    1. i=m时,A数据全部被分到左边,可能存在j=0的临界值情况,
      需保证:A[i-1] ≤ B[j]
    i=m
    1. 根据下面的推论可知,当i不为上面的值时,j不可能取到边界值:
    0<i<m
           else {
                // 前两个情况均为临界值,先检查异常情况
                if (p1 == 0) { // 长度较短的数组A达到最小值
                    // 即数组A全部被分到右边
                    left = nums2[p2 - 1];
                    // 存在数组B取到边界值的情况
                    if (p2 == size2) right = nums1[p1];
                    else right = min(nums1[p1], nums2[p2]);
                    break;
                } else if (p1 == size1) { // 长度较短的数组A达到最大值
                    // 即数组A全部被分到左边
                    right = nums2[p2];
                    if (p2 == 0) left = nums1[p1 - 1];
                    else left = max(nums1[p1 - 1], nums2[p2 - 1]);
                    break;
                } else {
                    // 在边界内
                    left = max(nums1[p1 - 1], nums2[p2 - 1]);
                    right = min(nums1[p1], nums2[p2]);
                    break;
                }
            }
    

    ps 具体代码参加GitHub地址:
    https://github.com/chenshuyuhhh/acm/blob/master/binary/findMedianSortedArrays.cpp

    相关文章

      网友评论

          本文标题:求第k小系列(二):在两个排序好的数组中找第k小

          本文链接:https://www.haomeiwen.com/subject/wguoghtx.html