【LeetCode】寻找两个有序数组的中位数【性质分析+二分】
给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。
你可以假设 nums1 和 nums2 不会同时为空。
示例 1:
nums1 = [1, 3]
nums2 = [2]则中位数是 2.0
示例 2:
nums1 = [1, 2]
nums2 = [3, 4]则中位数是 (2 + 3)/2 = 2.5
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/median-of-two-sorted-arrays
分析:
m为数组A元素数量
n为数组B元素数量
通过上图我们可以得知:
1.在合并后的大数组中,中位数的作用就是把数组分成元素数量相同的两部分,这两部分的元素是连续的,并且右侧的元素大于等于或者左侧的元素(也就是橙色元素大于或者等于绿色元素)
2.大数组中的元素不是来自于数组A就是来自于数组B,也就是说,数组A和数组B肯定是由分割线两侧的元素混合构成的(先不考虑特殊情况),由于他们都是有序数组,那么数组A和数组B中肯定也存在两条这样的分割线i和j,我们只需要在A数组和B数组中找到确切的i分割线和j分割线的位置,就可以确定大数组中分割线的位置,从而就可以确定中位数的位置
3.那么怎么寻找合适的i和j呢?
i和j满足的要求:i+j=(n+m+1)/2 (+1是为了保证元素总数量无论是奇数还是偶数该公式都成立)
根据公式知道,i和j只要确定了一个,另外一个也就确定了,所以我们只需要在数组A中寻找合适的i,那什么样的i才是合适的i呢?
合适的i和j必须要满足以下要求:
1)A[i]>=B[j-1]
2)B[j]>=A[i-1]
也就是保证所有橙色元素都大于或者等于绿色元素,换句话说就是为了保证大数组中右侧元素都大于或者等于左侧元素,只有这样的i和j才是合适的,才可以根据i和j确定大数组中位数的位置
那么当i和j不合适时,我们应该怎么调整呢?我们调整i,j也会随着变化,所有我只对i进行调整就好
当A[i]<B[j-1]时:说明i太小了,i应该右移
当B[j]<A[i-1]时:说明i太大了,i应该左移
我们可以通过二分的方式来移动i
当找到合适的i和j后
如果总元素数量为奇数,那么左侧最大元素max(A[i-1],B[j-1])就是中位数
如果总元素数量为偶数,那么左侧最大元素和右侧最小元素的平均值就是中位数
ps:右侧最小元素=min(A[i],B[j])
需要处理几种特殊情况:
1)如果B元素数量比A元素数量少的话,通过i得到的j值在数组B中可能会越界
解决方案:如果数组A的元素数量比数组B的元素数量多,那么交换A,B数组的元素,也就是说,i是在数组元素数量少的数组上移动的,这样通过i得到的j值在B数组肯定不会越界
2)i等于0的情况
这种情况下,i-1会越界,那么左侧的最大元素为B[j-1]就好
3)j等于0的情况
这种情况下,j-1会越界,那么左侧的最大元素为A[i-1]就好
4)i等于m的情况
这种情况下,A[m]元素取不到,也越界了,那么右侧最小元素为B[j]就好
5)j等于n的情况
这种情况下,B[j]元素取不到,也越界了,那么右侧最小元素为A[i]就好
时间复杂度分析:对A数组进行二分寻找合适的i,又因为A数组是元素数量最少的数组,所以该算法的时间复杂度为:O(log (min(m,n)))
空间复杂度:O(1)
另外一篇也很不错的博文:https://mp.weixin.qq.com/s/OE4lHO8-jOIxIfWO_1oNpQ
code:
double findMedianSortedArrays(vector<int>& A, vector<int>& B) { int m=A.size(); int n=B.size(); if(m>n)//i指向A数组,A为短数组可以避免j越界 { swap(A,B); swap(n,m); } int low=0; int high=m; int k=(m+n+1)/2; while(low<=high)//二分A数组 { int i=(low+high)/2;//i指向A数组 int j=k-i;//j指向B数组 if(i<high&&A[i]<B[j-1])//i太小,i需要右移 { low=i+1; }else if(i>low&&A[i-1]>B[j])//i太大,i需要左移 { high=i-1; }else//找到了合格的i,j { int maxleft; //特殊情况 if(i==0) { maxleft=B[j-1]; }else if(j==0) { maxleft=A[i-1]; }else { maxleft=max(A[i-1],B[j-1]);//获得左侧最大值 } if((m+n)%2==1)//如果两个数组的元素数量为奇数,那么左侧的最大值就是中位数 return maxleft*1.0; int minright; //特殊情况 if(i==m) { minright=B[j]; }else if(j==n) { minright=A[i]; }else { minright=min(A[i],B[j]);//获得右侧最小值 } return (maxleft+minright)/2.0;//元素总数量为偶数,那么中位数等于左侧最大值和右侧最小值的平均值 } } return 0.0; }
golang实现:
func max(x, y int) int {
	if x > y {
		return x
	}
	return y
}
func min(x, y int) int {
	if x < y {
		return x
	}
	return y
}
func findMedianSortedArrays(a []int, b []int) float64 {
	m := len(a)
	n := len(b)
	// 保证a数组为短数组,避免j越界
	if m > n {
		a, b = b, a
		m, n = n, m
	}
	// i为a数组中点,j为b数组中点,i和j具有关系:i+j=(m+n+1)/2
	// 第一步:在a数组中采用二分的方式寻找合适的i,满足以下关系: a[i]>=b[j-1] && b[j]>=a[i-1]
	k := (m + n + 1) / 2
	l := 0
	h := m
	var i,j int
	for l <= h {
		i = (l + h) / 2
		j = k - i // 通过i可以确定j的值
		if i <h && a[i] < b[j-1] {
			// i太小了,i需要增大,取二分的右半边
			l = i + 1
		} else if i > l && b[j] < a[i-1] {
			// i太大了,i需要减小,去二分的左半边
			h = i - 1
		}else  {
			// 寻找到了合适的i
			// i可能等于0或m ,j可能等于0或n 所以不要操作数组,避免越界错误
			break
		}
	}
	// 第二步:寻找到了合适的i,根据元素总数量的奇偶性判断如何取中位数
	// 情况1:元素总数量是奇数,那么左侧的最大元素max(a[i-1],b[j-1])就是中位数
	var leftMaxValue int
	// 特殊处理i等于0或者j等于0的特殊情况
	if i == 0 {
		leftMaxValue = b[j-1] // i-1越界,只取b[j-1]
	} else if j == 0 {
		leftMaxValue = a[i-1] // j-1 越界,只取a[i-1]
	} else {
		leftMaxValue = max(a[i-1], b[j-1])
	}
	if (n+m)%2 ==1 {
		return float64(leftMaxValue)
	}
	// 情况2:元素总数量是偶数,那么左侧最大元素max(a[i-1],b[j-1])和右侧最小元素min(a[i],b[j])的平均值就是中位数
	var rightminValue int
	// 特殊处理i等于m或j等于n的特殊情况
	if i == m {
		rightminValue = b[j] // i越界,只取b[j]
	} else if j == n {
		rightminValue = a[i] // j越界,只取a[i]
	} else {
		rightminValue = min(a[i], b[j])
	}
	return (float64(leftMaxValue) + float64(rightminValue)) / 2
}
另外一种时间复杂度稍微差点的方法
将求中位数转化为求第k大数,当k=(m+n+1)/2时,为原问题的解,那么怎么求两个数组的第k大数呢?
分别求出A数组和B数组的第k/2个数x和y,然后比较x,y
当x<y时,说明第k个数位于A数组的第k/2个数的后半段
当x>y时,说明第k个数位于B数组的第k/2个数的前半段
问题规模缩小了一般,然后递归处理就行了(特殊情况的细节没有说明,这里只讲解一下大概思路,因为该方法时间复杂度较高,为O(log(m+n))
golang实现
func max(x, y int) int {
	if x > y {
		return x
	}
	return y
}
func min(x, y int) int {
	if x < y {
		return x
	}
	return y
}
func findKth(a []int,aStart int,b []int,bStart int,k int) float64{
	// 任何一个数组为空,取另外一个数组的第k个数
	if aStart>=len(a){
		return float64(b[bStart+k-1])
	}
	if bStart>=len(b){
		return float64(a[aStart+k-1])
	}
	// k等于1,取两个首元素中小的那个
	if k==1{
		return float64(min(a[aStart],b[bStart]))
	}
	x,y:=math.MaxInt64,math.MaxInt64
	// 分别取a,b数组的第k/2个元素 x和y
	if aStart+k/2-1<len(a){
		x=a[aStart+k/2-1]
	}
	if bStart+k/2-1<len(b){
		y=b[bStart+k/2-1]
	}
	if x<y{
		// x小于y,第k个数位于a数组的第k/2个数的后半段,缩小区间 继续查找
		return findKth(a,aStart+k/2,b,bStart,k-k/2)
	}
	// x大于y,第k个数位于b数组的第k/2个数的前半段
	return findKth(a,aStart,b,bStart+k/2,k-k/2)
}
func findMedianSortedArrays(a []int, b []int) float64 {
	m:=len(a)
	n:=len(b)
	// 处理任何一个数组为空的情况
	if m==0{
		if n%2==0{
			return (float64(b[n/2])+float64(b[n/2-1]))/2
		}
		return float64(b[n/2])
	}
	if n==0{
		if m%2==0{
			return (float64(a[m/2])+float64(a[m/2-1]))/2
		}
		return float64(a[m/2])
	}
	total:= m+n
	// 总数为奇数,寻找第k个数 k=total/2+1
	if (m+n)%2==1{
		return findKth(a,0,b,0,total/2+1)
	}
	// 总数为偶数,寻找 第total/2个 和 第tatal/2+1个 数的平均值
	x:=findKth(a,0,b,0,total/2)
	y:=findKth(a,0,b,0,total/2+1)
	return (x+y)/2.0
}



 
                
            
         浙公网安备 33010602011771号
浙公网安备 33010602011771号