数组中的二分法查找

作者: dol_re_mi | 来源:发表于2014-11-11 10:22 被阅读1344次

    一维数组

    首先开始最基本的Binary Search, 数组是有序的,但是有重复数。
    例题: Search for a Range
    复杂度:时间O(log n), 空间O(1).
    分析: 首先需要复杂度在O(log n)左右,显然暗示了Binary Search是首选,然后注意这道题是需要找到一个range,并不是找到target的位置就可以了。因此在找到位置后,分别向左向右拓展到两边,返回这两个数就可以了。

     class Solution{     
      public:
        vector<int> searchRange(int A[], int n, int target) {
            vector<int> result(2,-1);
            int index = search(A, n, target);   
            if(index == -1)  return result;
            int l = index, r = index;
            while(l -1 >= 0 && A[l] == A[l-1]) --l;
            while(r +1 <= n-1 && A[r] == A[r+1]) ++r;
            result[0] = l;
            result[1] = r;
            return result;
       }      
    
     int search(int A[], int n , int target){  
         if(A == nullptr || n == 0) return -1;
      
         int left = 0, right = n -1;
         while(left <= right){
             int mid = left + (right - left) /2;
            
             if(target > A[mid])
                 left = mid + 1;
             else if(target < A[mid])
                 right = mid - 1;
             else if(target == A[mid])
                 return  mid;
         }
         return -1;
       }        
    };
    

    注意这里做binary search时候,对于A[mid]分为了三种不同情况讨论,相等,小于和大于,并且while循环的终止条件是left <= right,也就是说最后left > right时候表明目标数肯定不存在了。在对于不同的问题,这些边界条件会相应的改变。另外这样搜索如果最后目标数存在,最后结果一定是以A[mid]的形式。

    例题: Search Insert Position
    复杂度:时间O(log n), 空间O(1).
    分析:这道题的关键是如果目标数不存在,必须返回目标数可以插入的位置,这样经典的binary search返回A[mid]的方法(如上题)没法直接实现因此必须对循环的条件以及边界进行调整。首先当循环结束时候,为了能返回一个目标数可以插入的地址,我们必须让left == right也就是说循环条件相应调整为left < right. 如果需要设置循环里面的边界条件和left, right的初始条件,我们必须看一下最后一次循环时候的情况:最后一次循环时, left + 1 = right只剩下两个元素需要考虑(这里忽略数组只有一个元素的情形,因为一个元素时,程序根本不会进入循环),此时mid = left,如果target > A[mid], left = mid + 1 = right与之前情况类似,那么当target < A[mid]时候也就是说target并不存在,此时应该输出target元素需要插入的位置也就是left, 因此right = mid = left,当target = A[mid]情形与小于相同,right = mid = left.还有一种情况,当target大于数组里面所有数的时候,插入位置应该在所有数组之后,因此right的初始值必须是n,因为很容易发现前面的边界条件设置导致最后输出的left都会在两个初始值left和right之间。

    class Solution {
         public:
          int searchInsert(int A[], int n, int target) {
              if(A == nullptr || n == 0) return -1;
              int left = 0, right = n ;   
             while(left < right){
                int mid = left + (right - left) /2 ;
                if(target > A[mid])
                     left = mid + 1;
                else
                   right = mid;
              }
        
            return left;
         }
    };
    

    接下来,问题难度提高了,数组仍然有序并且无重复数,但是在某一点pivot截断并且移动了几位。
    例题: Search in Rotated Sorted Array
    复杂度: 时间O(log n), 空间O(1).
    分析:因为事先不知道数组会再哪里截断因此在while循环的边界条件需要调整来满足需求。因为存在数组中并不包含目标数的情况,因此希望所有循环结束时候仍然找不到目标数此时返回-1,另一方面也就是说在循环内部如果发现目标数A[mid] == target返回,当first == last时候循环结束, 判断条件与上一道题一样。下面看A[mid] != target的情形,因为pivot的存在,必须找到pivot在左边还是右边,办法就是比较A[first]和A[mid],如果A[first] < A[mid]说明pivot不在左边这段,因为pivot会破坏所在一段的连续递增性(递减性), 因此这里在左边用一般的binary search可以解决。如果A[first] > A[mid],pivot肯定会在左边,那么我们可以对右边进行binary search因为右边是连续递增(递减)的。下面再考虑边界条件还有初始条件,注意这里我们还是把初始条件设置为n即最后一位之后一位,那么在边界条件上需要变化,如果target属于[A[first], A[mid])之间,last变为mid,注意这里保持last是搜索范围最后一个数字的下一位。 同理在A[first] > A[mid]的情况下我们比较的是target <= A[last -1 ]由于last的初始值设置。 注意在讨论target和左右两个边界条件时候使用大于等于或者小于等于,注意等号是必须的。

    class Solution {
    public:
    int search(int A[], int n, int target) {
       if(A == nullptr || n == 0) return -1;
        int first = 0, last = n;
        while (first < last) {
            int mid = first + (last - first) / 2;
            if (A[mid] == target)
                return mid;
            if (A[first] < A[mid]) {
                if (A[first] <= target && target < A[mid])
                    last = mid;
                else
                    first = mid + 1;
            } else {
                if (A[mid] < target && target <= A[last-1])
                    first = mid + 1;
                else
                    last = mid;
                    }
            }
        return -1;
        }
    };
    

    下面继续提高难度,如果上面的那道题数组是可重复的呢?
    例题:Rotated Sorted Array II
    复杂度:时间O(n),空间O(1).
    分析:如果出现重复数最大的问题就是当A[left] == A[mid],此时没有办法判断pivot到底在哪里,比较简单的快速解决方案就是把left右移一位继续寻找。

    class Solution {
     public:
      bool search(int A[], int n, int target) {
        if(A == nullptr|| n == 0) return false;
        int left = 0, right = n;
        
        while(left < right){       
            int mid = left + (right - left)/2;
            if(A[mid] == target) 
                return true;
            
            if(A[left] < A[mid]){
                if(target < A[mid] && target >= A[left]){
                    right = mid;
                }else{
                    left = mid + 1;
                }
            }else if(A[left] > A[mid]){
                if(target <= A[right -1 ] && target > A[mid]){
                    left = mid + 1;
                }else{
                    right = mid;
                }
            }else{
                left++;
            }          
        }    
        return false;        
    }    
    

    };

    下面我们看一看数组查找的变形
    例题:Find Minimum in Rotated Sorted Array
    复杂度: 时间O(log n),空间O(1).
    分析:首先这道题和上两道题非常相似,唯一的区别就是目标不同:寻找最小值即pivot。首先假设变形前数组是从左至右递增,变形之后我们可以很容易发现最左边的元素num[left]永远大于最右边的元素mum[right]即num[left] > num[right]因为数组里没有重复元素。与之前不同,我们这里要找到pivot所在的区域而不是要避开,因此在循环内我们要比较的事num[mid]和num[right]之间的关系这道题不能比较num[start]和num[mid]因为没法排除特例当start == mid,如果num[mid] > num[right]即数组的递增性在右边是被破坏的,因此pivot肯定是在右边[mid+1, right],反之则是[left, mid].最后我们考虑终结条件,我们知道pivot有一个性质就是唯一存在i so that num[i -1] > num[i],这里num[i]就是pivot.我们看一下最后一次循环的情形,此时left + 1 = right 并且mid = left, 这里如果如果num[mid] > num[right],那么pivot就是left = right = mid + 1, 反之right = left = mid,因此跳出循环后left = right就是pivot所在的位置。

    class Solution {
    public:
      int findMin(vector<int> &num) {
         if(num.empty()) return 0;
         int left = 0;
         int right = n - 1;
    
         while(left < right ){
            int mid = left + (right - left)/2;
            
            if(num[mid] > num[right]){      
                left = mid + 1;
            }else {               
                right = mid ;
            }
        }
        
        return num[left];
      }
    };
    

    继续增加难度,如果允许重复数的存在呢?
    例题:Find Minimum in Rotated Sorted Array II
    复杂度: 时间O(n), 空间O(1).
    分析:如果出现重复数,唯一一种情况没办法处理就是A[mid] == A[left] == A[right],这次我们不采用上次的简单fix(把左边边界往右边移一位),而是写成recursive的形式在左右两边分别寻找最小值,这样复杂度会提高到O(n)了。

        class Solution {
     public:
       int findMin(vector<int> &num) {
          return  findmin(num, 0, num.size() -1);
         }
    
    int findmin(vector<int> &num, int left, int right){
       if(num.size() == 0) return -1; 
      while(left < right){        
            int mid = left + (right - left)/2;
            if(num[mid] > num[right]){
                left = mid + 1;
            }else if(num[mid] < num[right]){
                right = mid;
            }else{
                return min(findmin(num, left, mid), findmin(num, mid+1, right));
            }
        }
        return num[left];
       }
    };
    

    在我们结束探讨一维数组之前,再看一个经典的利用二分法查找的一维数组问题
    例题: Median of Two Sorted Array
    分析: 首先得弄明白median的定义,如果数组包含偶数个元素,median取中间两个数的平均值;如果数组包含个奇数个元素,那么median就是中间的那个数。下面继续看这道题,需要寻找的是两个排序的数组median,自然想到使用二分法来解。利用recursive的方法,每次比较数组A的中位数A[n/2]和数组B的中位数B[m/2],比较同时在考虑比较另外两个值m/2 + n/2 + 1和k(其中k是两个数组合并后的第k个元素),这样可以确定删除哪一部分继续搜索,原则是丢弃最大中位数的右区间或者最小中位数的左区间。最后就是边界条件的确定,假设其中一个数组为空了,那么返回的就是另一个数组的最后一个数。或者如果k = 1, 那么返回两个数组中第一个元素的较小值。

    class Solution {
    public:
    double findMedianSortedArrays(int A[], int m, int B[], int n) {
        if((m+n) %2 == 1){
            return findMedian(A, m, B, n, (m+n)/ 2 + 1);
        }else{
            return (findMedian(A, m, B, n, (m+n)/2) + findMedian(A, m, B, n, (m+n)/2 + 1))/2.0;
        }
    }
    private:
      double findMedian(int A[], int m, int B[], int n, int k){
        assert(A&&B);
        if(m <= 0) return B[k-1];
        if(n <= 0) return A[k-1];
        if(k == 1) return min(A[0], B[0]);
        if(B[n/2] >= A[m/2]){
            if((m/2 + n/2 + 1) >= k)
                return findMedian(A, m, B, n/2, k);
            else
                return findMedian(A + m/2 + 1, m - (m/2 + 1), B, n, k - m/2 -1);
        }else{
            if((m/2 + n/2 + 1) >= k)
                return  findMedian(A, m/2, B, n, k);
            else
               return findMedian(A, m, B + n/2 + 1, n - (n/2 + 1), k - n/2 - 1);
            
          }
        }
     };
    

    这道题还有更简洁的方法,即确保A数组的个数永远不大于B数组的个数,如果不是就交换这两个数组。

       class Solution {
         public:
       double findMedianSortedArrays(int A[], int m, int B[], int n) {
        int total = m + n;
        if( total & 0x1 ){
            return findMedian(A, m, B, n, total/2 + 1);
        }else{
            return (findMedian(A, m, B, n, total/2) + findMedian(A, m, B, n, total/2 + 1))/2.0;
        }
    }
      private:
       int findMedian(int A[], int m, int B[], int n, int k){
        if(m > n) return findMedian(B, n, A, m, k);
        if(m == 0) return B[k-1];
        if(k == 1) return min(A[0], B[0]);
        
        int ia = min(k/2, m), ib = k - ia;
        if(A[ia-1] < B[ib-1])
            return findMedian(A + ia, m -ia, B, n, k -ia);
        else if(A[ia - 1] > B[ib - 1])
            return findMedian(A, m, B +ib, n -ib, k -ib);
        else
            return A[ia - 1];
           }
      };
    

    二维数组

    例题: Search a 2D matrix
    复杂度: 时间O(log (m*n)), 空间O(1).
    分析:首先这道题中二维数组有两个特点:

    • 每一行数是递增的
    • 每一行第一个数都小于上一行的最后一个数
      因此很自然的想到把二维数组压平为一位数组,然后使用binary search解决。
      class Solution {
    public:
      bool searchMatrix(vector<vector<int> > &matrix, int target) {
         if(matrix.empty() || matrix.front().size()) return false;
       
         int m = matrix.size();
         int n = matrix.front().size();
         int left = 0;
         int right = m*n;
       
         while(left < right){
           
            int mid = left + (right - left) /2;
            int middle = matrix[mid / n][mid % n];
           
            if(target == middle){
                return true;
            }else if(target > middle){
                left = mid + 1;
            }else{
                right = mid;
            }
         }
          return false;
       }
    };
    

    相关文章

      网友评论

        本文标题:数组中的二分法查找

        本文链接:https://www.haomeiwen.com/subject/onqbtttx.html