分治算法思想介绍

一,介绍

分治算法主要包含两个步骤:分、治。分,就是递归地将原问题分解成小问题;治则是:在解决了各个小问题之后(各个击破之后)合并小问题的解,从而得到整个问题的解

 

二,分治递归表达式

分治算法一般都可以写出一个递归表达式;比如经典的归并排序的递归表达式:T(N)=2T(N/2)+O(N)

T(N)代表整个原问题,采用了分治解决方案后,它可以表示成:

①分解成了两个规模只有原来一半(N/2)的子问题:T(N/2)

②当解决完这两个子问题T(N/2)之后,再合并这两个子问题需要的代价是 O(N)

递归表达式的解就是该算法的时间复杂度。关于某些特定形式的递归表达式,求解时,是可以直接套公式的:

T(N)=aT(N/b)+Θ(N^K) 表示将原问题分解成 a 个 规模大小为 N/b 的子问题,合并这 a 个子问题的代价是 Θ(N^K)  (N^k 表示 N 的 k 次方)

T(N)的解有以下三种情况:

1) T(N)=O(N^logba)   当 a > bk

2) T(N)=O(Nk logN)   当 a = bk

3) T(N)=O(Nk)   当 a < bk

 

三,分治算法的一些实例分析

①最近点问题,参考《数据结构与算法分析》Mark Allen Wiess著 第10章

问题描述:在一个平面上分布着若干个点,点与点之间的距离公式为:[(x1-x2)2 + (y1-y2)2]1/2

找出,距离最小的那两个点

假设平面上有N个点,这N个点之间共有 1+2+3+……+(N-1) = N(N-1)/2 个距离,采用穷举,时间复杂度为O(N^2);而采用分治则可以做到O(NlogN)

那如何应用分治呢?

首先将N个点按照 X轴坐标进行排序,排序算法的时间复杂度为O(NlogN),故相对于穷举而言,它不影响总是时间复杂度。因为O(NlogN) << O(N^2)(远远小于)

按X轴坐标排序后,可以划一条垂直于X轴的线,将所有的点划分成两半。那么,点与点之间的距离就会出现三种情况:

a)两个点完全处于垂线的左边,那么这两点的距离不会越过垂线,这类距离记为 DL

b)两个点完全处于垂线的右边,那么这两点的距离不会越过垂线,这类距离记为 DR

c)两个点一个在垂线的左边,一个在垂线的右边,因此这两个的距离会横跨垂线

这种划分思想,在求解:最大子序列的和 时,也可以采用。

设 minD = min{DL,DR},即minD是 a)  和 b) 这两种情况下的所有距离中最小的那个距离。

那么,可以用数学证明:处于[-minD, minD]这个范围内的点平均只有 O(sqrt(N))个。

而sqrt(N)个点,一共有 O(N)个距离对,因为N个点一共有N(N-1)/2,即O(N^2)个距离对

这样,我们可以将处于 c) 中的点对距离 采用穷举来查找出最小的距离,复杂度为O(N)

而,处于a) 和 b) 中的点可以 继续进行递归划分。

从而,递归表达式为: T(N)=2T(N/2)+O(N) ,而这个表达式的解为:T(N)=O(NlogN)

也就是说,采用了分治,成功地将原问题从O(N^2) 降低为 O(NlogN)

 

②K选择问题

问题描述:给出N个数,找出其中第K小的元素

如果直接用穷举,一共需要比较K*N次,当K与N有关时,比如K是中位数(K=N/2),时间复杂度为O(N^2).

而采用分治,则可把复杂度降低为O(N)

首先在N个数选出一个枢轴元素,将比枢轴元素的元素放到 枢轴元素的右边,将比枢轴元素小的元素放到枢轴元素的左边。这样,把N个数,分成了两部分,一部分,记为S(1) 它们都比枢轴大,另一部分记为S(2),它们都比枢轴小。这就是分治 的 分。

假设一种理想的情况:枢轴元素 基本位于中间值,即它 总是将原数组划分成两个两个大小基本相等的子数组:S(1) 和 S(2)

要求解第K小的元素,有三种情况:

a) 若 K < |S(1)|,说明:第K小的元素位于 S(1)这个子数组中。   其中,|S(1)| 表示 S(1) 数组中元素的个数。

b) 若 K == |S(1)| + 1,说明:第K小的元素,刚好是枢轴元素

c) 否则,第K个的元素位于 S(2)子数组中

如果是情况 a) 或者 情况 c) ,可以继续递归分解子数组。

分解问题之后:将N个元素,分成了两个 N/2 个元素的子数组,只需要在其中一个子数组中进行查找即可,使用穷举查找,复杂度为O(N/2)。

递归表达式: T(N)=T(N/2)+O(N/2),这个递归表达式的解为O(N)

这说明,采用分治,可以将K选择问题的时间复杂度降低为O(N)

顺便说一句,这与快速排序的划分非常的相似,只不过快速排序需要处理两个子数组(对划分的两个子数组分别进行快速排序)。而这里只需要处理其中某一个子数组,因为若第K小元素处于S(1)子数组中,那么它一定不会在S(2)子数组中了,因此我们就不需要再处理S(2)子数组了。

 

原文:http://www.cnblogs.com/hapjin/p/5538912.html

posted @ 2016-05-29 10:15  hapjin  阅读(6907)  评论(0编辑  收藏