【LeetCode】寻找两个有序数组的中位数【性质分析+二分】
给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。
你可以假设 nums1 和 nums2 不会同时为空。
示例 1:
nums1 = [1, 3]
nums2 = [2]则中位数是 2.0
示例 2:
nums1 = [1, 2]
nums2 = [3, 4]则中位数是 (2 + 3)/2 = 2.5
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/median-of-two-sorted-arrays
分析:
m为数组A元素数量
n为数组B元素数量
通过上图我们可以得知:
1.在合并后的大数组中,中位数的作用就是把数组分成元素数量相同的两部分,这两部分的元素是连续的,并且右侧的元素大于等于或者左侧的元素(也就是橙色元素大于或者等于绿色元素)
2.大数组中的元素不是来自于数组A就是来自于数组B,也就是说,数组A和数组B肯定是由分割线两侧的元素混合构成的(先不考虑特殊情况),由于他们都是有序数组,那么数组A和数组B中肯定也存在两条这样的分割线i和j,我们只需要在A数组和B数组中找到确切的i分割线和j分割线的位置,就可以确定大数组中分割线的位置,从而就可以确定中位数的位置
3.那么怎么寻找合适的i和j呢?
i和j满足的要求:i+j=(n+m+1)/2 (+1是为了保证元素总数量无论是奇数还是偶数该公式都成立)
根据公式知道,i和j只要确定了一个,另外一个也就确定了,所以我们只需要在数组A中寻找合适的i,那什么样的i才是合适的i呢?
合适的i和j必须要满足以下要求:
1)A[i]>=B[j-1]
2)B[j]>=A[i-1]
也就是保证所有橙色元素都大于或者等于绿色元素,换句话说就是为了保证大数组中右侧元素都大于或者等于左侧元素,只有这样的i和j才是合适的,才可以根据i和j确定大数组中位数的位置
那么当i和j不合适时,我们应该怎么调整呢?我们调整i,j也会随着变化,所有我只对i进行调整就好
当A[i]<B[j-1]时:说明i太小了,i应该右移
当B[j]<A[i-1]时:说明i太大了,i应该左移
我们可以通过二分的方式来移动i
当找到合适的i和j后
如果总元素数量为奇数,那么左侧最大元素max(A[i-1],B[j-1])就是中位数
如果总元素数量为偶数,那么左侧最大元素和右侧最小元素的平均值就是中位数
ps:右侧最小元素=min(A[i],B[j])
需要处理几种特殊情况:
1)如果B元素数量比A元素数量少的话,通过i得到的j值在数组B中可能会越界
解决方案:如果数组A的元素数量比数组B的元素数量多,那么交换A,B数组的元素,也就是说,i是在数组元素数量少的数组上移动的,这样通过i得到的j值在B数组肯定不会越界
2)i等于0的情况
这种情况下,i-1会越界,那么左侧的最大元素为B[j-1]就好
3)j等于0的情况
这种情况下,j-1会越界,那么左侧的最大元素为A[i-1]就好
4)i等于m的情况
这种情况下,A[m]元素取不到,也越界了,那么右侧最小元素为B[j]就好
5)j等于n的情况
这种情况下,B[j]元素取不到,也越界了,那么右侧最小元素为A[i]就好
时间复杂度分析:对A数组进行二分寻找合适的i,又因为A数组是元素数量最少的数组,所以该算法的时间复杂度为:O(log (min(m,n)))
空间复杂度:O(1)
另外一篇也很不错的博文:https://mp.weixin.qq.com/s/OE4lHO8-jOIxIfWO_1oNpQ
code:
double findMedianSortedArrays(vector<int>& A, vector<int>& B) { int m=A.size(); int n=B.size(); if(m>n)//i指向A数组,A为短数组可以避免j越界 { swap(A,B); swap(n,m); } int low=0; int high=m; int k=(m+n+1)/2; while(low<=high)//二分A数组 { int i=(low+high)/2;//i指向A数组 int j=k-i;//j指向B数组 if(i<high&&A[i]<B[j-1])//i太小,i需要右移 { low=i+1; }else if(i>low&&A[i-1]>B[j])//i太大,i需要左移 { high=i-1; }else//找到了合格的i,j { int maxleft; //特殊情况 if(i==0) { maxleft=B[j-1]; }else if(j==0) { maxleft=A[i-1]; }else { maxleft=max(A[i-1],B[j-1]);//获得左侧最大值 } if((m+n)%2==1)//如果两个数组的元素数量为奇数,那么左侧的最大值就是中位数 return maxleft*1.0; int minright; //特殊情况 if(i==m) { minright=B[j]; }else if(j==n) { minright=A[i]; }else { minright=min(A[i],B[j]);//获得右侧最小值 } return (maxleft+minright)/2.0;//元素总数量为偶数,那么中位数等于左侧最大值和右侧最小值的平均值 } } return 0.0; }
golang实现:
func max(x, y int) int {
if x > y {
return x
}
return y
}
func min(x, y int) int {
if x < y {
return x
}
return y
}
func findMedianSortedArrays(a []int, b []int) float64 {
m := len(a)
n := len(b)
// 保证a数组为短数组,避免j越界
if m > n {
a, b = b, a
m, n = n, m
}
// i为a数组中点,j为b数组中点,i和j具有关系:i+j=(m+n+1)/2
// 第一步:在a数组中采用二分的方式寻找合适的i,满足以下关系: a[i]>=b[j-1] && b[j]>=a[i-1]
k := (m + n + 1) / 2
l := 0
h := m
var i,j int
for l <= h {
i = (l + h) / 2
j = k - i // 通过i可以确定j的值
if i <h && a[i] < b[j-1] {
// i太小了,i需要增大,取二分的右半边
l = i + 1
} else if i > l && b[j] < a[i-1] {
// i太大了,i需要减小,去二分的左半边
h = i - 1
}else {
// 寻找到了合适的i
// i可能等于0或m ,j可能等于0或n 所以不要操作数组,避免越界错误
break
}
}
// 第二步:寻找到了合适的i,根据元素总数量的奇偶性判断如何取中位数
// 情况1:元素总数量是奇数,那么左侧的最大元素max(a[i-1],b[j-1])就是中位数
var leftMaxValue int
// 特殊处理i等于0或者j等于0的特殊情况
if i == 0 {
leftMaxValue = b[j-1] // i-1越界,只取b[j-1]
} else if j == 0 {
leftMaxValue = a[i-1] // j-1 越界,只取a[i-1]
} else {
leftMaxValue = max(a[i-1], b[j-1])
}
if (n+m)%2 ==1 {
return float64(leftMaxValue)
}
// 情况2:元素总数量是偶数,那么左侧最大元素max(a[i-1],b[j-1])和右侧最小元素min(a[i],b[j])的平均值就是中位数
var rightminValue int
// 特殊处理i等于m或j等于n的特殊情况
if i == m {
rightminValue = b[j] // i越界,只取b[j]
} else if j == n {
rightminValue = a[i] // j越界,只取a[i]
} else {
rightminValue = min(a[i], b[j])
}
return (float64(leftMaxValue) + float64(rightminValue)) / 2
}
另外一种时间复杂度稍微差点的方法
将求中位数转化为求第k大数,当k=(m+n+1)/2时,为原问题的解,那么怎么求两个数组的第k大数呢?
分别求出A数组和B数组的第k/2个数x和y,然后比较x,y
当x<y时,说明第k个数位于A数组的第k/2个数的后半段
当x>y时,说明第k个数位于B数组的第k/2个数的前半段
问题规模缩小了一般,然后递归处理就行了(特殊情况的细节没有说明,这里只讲解一下大概思路,因为该方法时间复杂度较高,为O(log(m+n))
golang实现
func max(x, y int) int {
if x > y {
return x
}
return y
}
func min(x, y int) int {
if x < y {
return x
}
return y
}
func findKth(a []int,aStart int,b []int,bStart int,k int) float64{
// 任何一个数组为空,取另外一个数组的第k个数
if aStart>=len(a){
return float64(b[bStart+k-1])
}
if bStart>=len(b){
return float64(a[aStart+k-1])
}
// k等于1,取两个首元素中小的那个
if k==1{
return float64(min(a[aStart],b[bStart]))
}
x,y:=math.MaxInt64,math.MaxInt64
// 分别取a,b数组的第k/2个元素 x和y
if aStart+k/2-1<len(a){
x=a[aStart+k/2-1]
}
if bStart+k/2-1<len(b){
y=b[bStart+k/2-1]
}
if x<y{
// x小于y,第k个数位于a数组的第k/2个数的后半段,缩小区间 继续查找
return findKth(a,aStart+k/2,b,bStart,k-k/2)
}
// x大于y,第k个数位于b数组的第k/2个数的前半段
return findKth(a,aStart,b,bStart+k/2,k-k/2)
}
func findMedianSortedArrays(a []int, b []int) float64 {
m:=len(a)
n:=len(b)
// 处理任何一个数组为空的情况
if m==0{
if n%2==0{
return (float64(b[n/2])+float64(b[n/2-1]))/2
}
return float64(b[n/2])
}
if n==0{
if m%2==0{
return (float64(a[m/2])+float64(a[m/2-1]))/2
}
return float64(a[m/2])
}
total:= m+n
// 总数为奇数,寻找第k个数 k=total/2+1
if (m+n)%2==1{
return findKth(a,0,b,0,total/2+1)
}
// 总数为偶数,寻找 第total/2个 和 第tatal/2+1个 数的平均值
x:=findKth(a,0,b,0,total/2)
y:=findKth(a,0,b,0,total/2+1)
return (x+y)/2.0
}



浙公网安备 33010602011771号