当前位置: 首页 > 文档资料 > 算法珠玑 >

search/median-of-two-sorted-arrays

优质
小牛编辑
127浏览
2023-12-01

Median of Two Sorted Arrays

描述

There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

分析

这是一道非常经典的题。这题更通用的形式是,给定两个已经排序好的数组,找到两者所有元素中第k大的元素。

O(m+n)的解法比较直观,直接 merge 两个数组,然后求第k大的元素。

不过我们仅仅需要第k大的元素,是不需要“排序”这么昂贵的操作的。可以用一个计数器,记录当前已经找到第m大的元素了。同时我们使用两个指针pApB,分别指向 A 和 B 数组的第一个元素,使用类似于 merge sort 的原理,如果数组 A 当前元素小,那么pA++,同时m++;如果数组 B 当前元素小,那么pB++,同时m++。最终当m等于k的时候,就得到了我们的答案,O(k)时间,O(1)空间。但是,当k很接近m+n的时候,这个方法还是O(m+n)的。

有没有更好的方案呢?我们可以考虑从k入手。如果我们每次都能够删除一个一定在第k大元素之前的元素,那么我们需要进行k次。但是如果每次我们都删除一半呢?由于 A 和 B 都是有序的,我们应该充分利用这里面的信息,类似于二分查找,也是充分利用了“有序”。

假设 A 和 B 的元素个数都大于k/2,我们将 A 的第k/2个元素(即A[k/2-1])和 B 的第k/2个元素(即B[k/2-1])进行比较,有以下三种情况(为了简化这里先假设k为偶数,所得到的结论对于k是奇数也是成立的):

  • A[k/2-1] == B[k/2-1]
  • A[k/2-1] > B[k/2-1]
  • A[k/2-1] < B[k/2-1]

如果A[k/2-1] < B[k/2-1],意味着A[0]A[k/2-1]的肯定在$$A \cup B$$的 top k 元素的范围内,换句话说,A[k/2-1]不可能大于$$A \cup B$$的第k大元素。留给读者证明。

因此,我们可以放心的删除 A 数组的这k/2个元素。同理,当A[k/2-1] > B[k/2-1]时,可以删除 B 数组的k/2个元素。

A[k/2-1] == B[k/2-1]时,说明找到了第k大的元素,直接返回A[k/2-1]B[k/2-1]即可。

因此,我们可以写一个递归函数。那么函数什么时候应该终止呢?

  • 当 A 或 B 是空时,直接返回B[k-1]A[k-1]
  • k=1是,返回min(A[0], B[0])
  • A[k/2-1] == B[k/2-1]时,返回A[k/2-1]B[k/2-1]

代码

// Median of Two Sorted Arrays
// Time Complexity: O(log(m+n)),Space Complexity: O(log(m+n))
public class Solution {
    public double findMedianSortedArrays(final int[] A, final int[] B) {
        int total = A.length + B.length;
        if (total %2 == 1)
            return findKth(A, 0, B, 0, total / 2 + 1);
        else
            return (findKth(A, 0, B, 0, total / 2)
                    + findKth(A, 0, B, 0, total / 2 + 1)) / 2.0;
    }

    private static int findKth(final int[] A, int ai, final int[] B, int bi, int k) {
        //always assume that A is shorter than B
        if (A.length - ai > B.length - bi) {
            return findKth(B, bi, A, ai, k);
        }
        if (A.length - ai == 0) return B[bi + k - 1];
        if (k == 1) return Math.min(A[ai], B[bi]);

        //divide k into two parts
        int k1 = Math.min(k / 2, A.length - ai), k2 = k - k1;
        if (A[ai + k1 - 1] < B[bi + k2 - 1])
            return findKth(A, ai + k1, B, bi, k - k1);
        else if (A[ai + k1 - 1] > B[bi + k2 - 1])
            return findKth(A, ai, B, bi + k2, k - k2);
        else
            return A[ai + k1 - 1];
    }
};
// Median of Two Sorted Arrays
// Time Complexity: O(log(m+n)),Space Complexity: O(log(m+n))
class Solution {
public:
    double findMedianSortedArrays(const vector<int>& A, const vector<int>& B) {
        const int total = A.size() + B.size();
        if (total %2 == 1)
            return find_kth(A.begin(), m, B.begin(), n, total / 2 + 1);
        else
            return (find_kth(A.begin(), m, B.begin(), n, total / 2)
                    + find_kth(A.begin(), m, B.begin(), n, total / 2 + 1)) / 2.0;
    }
private:
    static int find_kth(std::vector<int>::const_iterator A, int m,
            std::vector<int>::const_iterator B, int n, int k) {
        //always assume that m is equal or smaller than n
        if (m > n) return find_kth(B, n, A, m, k);
        if (m == 0) return *(B + k - 1);
        if (k == 1) return min(*A, *B);

        //divide k into two parts
        int ia = min(k / 2, m), ib = k - ia;
        if (*(A + ia - 1) < *(B + ib - 1))
            return find_kth(A + ia, m - ia, B, n, k - ia);
        else if (*(A + ia - 1) > *(B + ib - 1))
            return find_kth(A, m, B + ib, n - ib, k - ib);
        else
            return A[ia - 1];
    }
};