分治算法详解及经典例题

Posted on 2018-12-17 09:02 Charlie_ODD 阅读(25215) 评论(0) 编辑收藏举报

一、基本概念

在计算机科学中，分治法是一种很重要的算法。字面上的解释是“分而治之”，就是把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解，原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础，如排序算法(快速排序，归并排序)，傅立叶变换(快速傅立叶变换)……

任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小，越容易直接求解，解题所需的计算时间也越少。例如，对于n个元素的排序问题，当n=1时，不需任何计算。n=2时，只要作一次比较即可排好序。n=3时只要作3次比较即可，…。而当n较大时，问题就不那么容易处理了。要想直接解决一个规模较大的问题，有时是相当困难的。

二、基本思想及策略

分治法的设计思想是：将一个难以直接解决的大问题，分割成一些规模较小的相同问题，以便各个击破，分而治之。

分治策略是：对于一个规模为n的问题，若该问题可以容易地解决（比如说规模n较小）则直接解决，否则将其分解为k个规模较小的子问题，这些子问题互相独立且与原问题形式相同，递归地解这些子问题，然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。

如果原问题可分割成k个子问题，1<k≤n，且这些子问题都可解并可利用这些子问题的解求出原问题的解，那么这种分治法就是可行的。由分治法产生的子问题往往是原问题的较小模式，这就为使用递归技术提供了方便。在这种情况下，反复应用分治手段，可以使子问题与原问题类型一致而其规模却不断缩小，最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。分治与递归像一对孪生兄弟，经常同时应用在算法设计之中，并由此产生许多高效算法。

三、分治法适用的情况

分治法所能解决的问题一般具有以下几个特征：

1) 该问题的规模缩小到一定的程度就可以容易地解决

2) 该问题可以分解为若干个规模较小的相同问题，即该问题具有最优子结构性质。

3) 利用该问题分解出的子问题的解可以合并为该问题的解；

4) 该问题所分解出的各个子问题是相互独立的，即子问题之间不包含公共的子子问题。

第一条特征是绝大多数问题都可以满足的，因为问题的计算复杂性一般是随着问题规模的增加而增加；

第二条特征是应用分治法的前提它也是大多数问题可以满足的，此特征反映了递归思想的应用；、

第三条特征是关键，能否利用分治法完全取决于问题是否具有第三条特征，如果具备了第一条和第二条特征，而不具备第三条特征，则可以考虑用贪心法或动态规划法。

第四条特征涉及到分治法的效率，如果各子问题是不独立的则分治法要做许多不必要的工作，重复地解公共的子问题，此时虽然可用分治法，但一般用动态规划法较好。

四、可使用分治法求解的一些经典问题

（1）二分搜索

（2）大整数乘法

（3）Strassen矩阵乘法

（4）棋盘覆盖

（5）合并排序

（6）快速排序

（7）线性时间选择

（8）最接近点对问题

（9）循环赛日程表

（10）汉诺塔

五、分治法的基本步骤

分治法在每一层递归上都有三个步骤：

step1 分解：将原问题分解为若干个规模较小，相互独立，与原问题形式相同的子问题；

step2 解决：若子问题规模较小而容易被解决则直接解，否则递归地解各个子问题

step3 合并：将各个子问题的解合并为原问题的解。

它的一般的算法设计模式如下：

Divide-and-Conquer(P)

1. if |P|≤n0

2. then return(ADHOC(P))

3. 将P分解为较小的子问题 P1 ,P2 ,…,Pk

4. for i←1 to k

5. do yi ← Divide-and-Conquer(Pi) △ 递归解决Pi

6. T ← MERGE(y1,y2,…,yk) △ 合并子问题

7. return(T)

其中|P|表示问题P的规模；n0为一阈值，表示当问题P的规模不超过n0时，问题已容易直接解出，不必再继续分解。ADHOC(P)是该分治法中的基本子算法，用于直接解小规模的问题P。因此，当P的规模不超过n0时直接用算法ADHOC(P)求解。算法MERGE(y1,y2,…,yk)是该分治法中的合并子算法，用于将P的子问题P1 ,P2 ,…,Pk的相应的解y1,y2,…,yk合并为P的解。

六、分治法的复杂性分析

一个分治法将规模为n的问题分成k个规模为n／m的子问题去解。设分解阀值n0=1，且adhoc解规模为1的问题耗费1个单位时间。再设将原问题分解为k个子问题以及用merge将k个子问题的解合并为原问题的解需用f(n)个单位时间。用T(n)表示该分治法解规模为|P|=n的问题所需的计算时间，则有：

T（n）= k T(n/m)+f(n)

通过迭代法求得方程的解

七、依据分治法设计程序时的思维过程

实际上就是类似于数学归纳法，找到解决本问题的求解方程公式，然后根据方程公式设计递归程序。

1、一定是先找到最小问题规模时的求解方法

2、然后考虑随着问题规模增大时的求解方法

3、找到求解的递归函数式后（各种规模或因子），设计递归程序即可。

八、算法举例

（1）二分查找

二分查找也是典型的分治算法的有应用。二分查找需要一个默认的前提，那就是查找的数列是有序的。
二分查找的思路比较简单：
1）选择一个标志i将集合分为二个子集合
2）判断标志L(i)是否能与要查找的值des相等，相等则直接返回
3）否则判断L(i)与des的大小
4）基于判断的结果决定下步是向左查找还是向右查找
5）递归记性上面的步骤

（2）输油管道问题

解题思路
本题目可以分为两个步骤：

　　1、找出主管道的位置；
　　2、根据主管道的位置，计算各个油井到主管道的长度之和。

根据题意，设主管道贯穿东西，与y 轴平行。而各个子油井则分布在主输油管道的上下两侧。如下图：

由上图，其实只需要确定主管道的y 坐标，而与各个子油井的x 坐标无关！

根据猜测，易知：主管道的y 坐标就是所有子油井y 坐标的中位数。（可以用平面几何知识证明，略）

求中位数的方法可以用排序后取a[(left+right)/2]，当然更推荐用书上的线性时间选择算法解决。记求得的主管道为Ym，

最后要输出的结果只需要计算,每个油井与中位数的差值之和。

#include <stdlib.h>

#include <stdio.h>

void swap(int &a,int &b)
{ 
 int    tmp = a; 
        a = b;  
        b = tmp; 
}

 //(此处的划分就体现了分治的思想)本函数求arr[p:q]的一个划分i，使arr[p:i-1]都小于arr[i]，arr[i+1,q]都大于arr[i]
int partition(int *arr,int p,int q) { 
 　　int index = p-1,
　　　　 start = p,
　　　　 base = arr[q];
　　for(;start<q;start++)  { 
  　　　　if(arr[start]<=base) {
　　　　　　　　swap(arr[start],arr[++index]);
　　　　　　}
　　　　}
　　　　swap(arr[++index],arr[q]);
　　　　return index;
}

//快速排序
void qsort (int *arr,int p ,int q) {
　　if (p<=q) {
　　　　int pos = partition(arr,p,q);
　　　　qsort(arr,p,pos-1);
　　　　qsort(arr,pos+1,q);
　　　}
}
int arr[1000];

int main() {
　　int n;
　　while(scanf("%d",&n)!=EOF){
　　　　for(int i=0;i<n;i++){
　　　　　　scanf("%d %d",&arr[i],&arr[i]);
　　　　}
　　　　qsort(arr,0,n-1);
　　　　long sum = 0;
　　　　int mid = arr[n/2];
　　　　for(int i=0;i<n;i++){
　　　　　　sum+=abs(mid - arr[i]);
　　　　}
　　　　printf("%I64d\n",sum);
　　}
return 0;
}

说明：类似的还有邮局选址问题：与之类似，这次是要找出在居民点中邮局的最佳位置。很容易想到，这次不仅要确定y的坐标，还要确定x的坐标。当然均为其对应坐标的中位数；最终的计算结果，要求距离之和，即向量模的计算方法加和即可。

（3）集合的划分

F（n,m）表示把n个元素的集合分为m个子集，有多少种分法？

n个元素的集合可以划为F（n,m）个不同的由m个非空子集组成的集合。

考虑3个元素的集合，可划分为：

① 1个子集的集合：{ {1，2，3} }

② 2个子集的集合：{{1，2} ，{3}} ， {{1，3}，{2}} ， {{2，3}，{1}}

③ 3个子集的集合：{{1}，{2}，{3}}

所以 F（3，1）=1

　　 F（3，2）=3

　　 F（3，3）=1

如果要求F（4，2）该怎么办呢？

A.往①里添加一个元素 {4} ，得到{{1，2，3}，{4}}

B.往②里的任意一个子集添一个4，得到

{{1，2，4}，{3}} ， {{1，2}，{3，4}}

{{1，3，4}，{2}} ， {{1，3}，{2，4}}

{{2，3，4}，{1}} ， {{2，3}，{1，4}}

所以F（4，2） = F（3，1）+2*F（3，2） = 7

以此推广得，F（n，m） = F （n-1，m-1）+ m * F（n-1，m）

#include <stdio.h>

long long divide( int  n,int  m) {

　　if (m==1 || m ==n){

　　　　return 1;
　　}else{

　　　　return divide(n-1,m-1)+m*divide(n-1,m);
　　}

}

int main(){

　　int  n,m;

　　while (scanf("%d%d",&n,&m) != EOF){

　　　　printf("%I64d\n",divide(n,m));
　　}

　　return 0;

}

（4）求复杂度为O（lg n）的X的 n 次幂

#include "stdio.h"
#include "stdlib.h"

int power(int x, int n)
{
    int result;
    if(n == 1)
        return x;
    if( n % 2 == 0)
        result = power(x, n/2) * power(x, n / 2);
    else
        result = power(x, (n+1) / 2) * power(x, (n-1) / 2);

    return result;
}

int main()
{
    int x = 5;
    int n = 3;

    printf("power(%d,%d) = %d \n",x, n, power(x, n));
}

（5）二路归并排序

描述：
时间复杂度是O(NlogN)，空间复制度为O(N)（归并排序的最大缺陷）
归并排序（Merge Sort）完全遵循上述分治法三个步骤：
1、分解：将要排序的n个元素的序列分解成两个具有n/2个元素的子序列；
2、解决：使用归并排序分别递归地排序两个子序列；
3、合并：合并两个已排序的子序列，产生原问题的解。

数组代码实现：

#include "stdio.h"
#include "stdlib.h"
#include "assert.h"
#include "string.h"

void print_arr(int *arr, int len)
{
    int i = 0;

    for(i = 0; i < len; i ++)
        printf("%d ",arr[i]);
    printf("\n");
}

void merge(int *arr, int low, int mid, int hight, int *tmp)
{
    assert(arr && low >= 0 && low <= mid && mid <= hight);


    int i = low;
    int j = mid + 1;
    int index = 0;

    while(i <= mid && j <= hight)
    {
        if(arr[i] <= arr[j])
            tmp[index++] = arr[i++];
        else
            tmp[index++] = arr[j++];
    }

    while(i <= mid) //拷贝剩下的左半部分
        tmp[index++] = arr[i++];

    while(j <= hight) //拷贝剩下的右半部分
        tmp[index++] = arr[j++];


    memcpy((void *)(arr + low), (void *)tmp, (hight - low + 1) * sizeof(int));



}

void mergesort(int *arr, int low, int hight, int *tmp)
{
    assert(arr && low >= 0);
    int mid;
    if(low < hight)
    {
        mid = (hight + low) >> 1;
        mergesort(arr, low, mid,tmp);
        mergesort(arr, mid + 1, hight,tmp);
        merge(arr, low, mid, hight,tmp);
    }
}
//只分配一次内存，避免内存操作开销
void mergesort_drive(int *arr, int len)
{
    int *tmp = (int *)malloc(len * sizeof(int));
    if(!tmp)
    {
        printf("out of memory\n");
        exit(0);
    }

    mergesort(arr, 0, len - 1, tmp);

    free(tmp);
}

int main()
{
    int data[10]={8,7,2,6,9,10,3,4,5,1};

    int len = sizeof(data)/sizeof(data[0]);
    mergesort_drive(data, len);
    print_arr(data,len);

    return 0;
}

（6）整数划分问题

/*
整数划分问题
：将一个整数划分为若干个数相加
例子：
整数4 最大加数 4
4=4
1+3=4
1+1+2=4
2+2=4
1+1+1+1=4
一共五种划分方案
注意：1+3=4，3+1=4被认为是同一种划分方案
*/

#include<stdio.h>
int q(int n,int m)//n表示需要划分的数字，m表示最大的加数不超过m
{
    if(m==1||n==1)//只要存在一个为1，那么划分的方法数肯定只有一种，那就是n个1相加
    {
        return 1;
    }else if(n==m&&n>1)//二者相等且大于1的时候，问题等价于：q(n,n-1)+1;意味着将最大加数减一之后n的划分数，然后加一，最后面那个一代表的是：0+n，这个划分的方案
    {
        return q(n,n-1)+1;
    }else if(n<m)//如果m>n,那么令m=n就ok，因为最大加数在逻辑上不可能超过n
    {
        return q(n,n);
    }else if(n>m)
    {
        return q(n,m-1)+q(n-m,m);//分为两种：划分方案没有m的情况+划分方案有m的情况
    }
    return 0;
}
int main()
{
    printf("请输入需要划分的数字和最大家数：\n");
    int n,m;
    scanf("%d %d",&n,&m);
    int r=q(n,m);
    printf("%d\n",r);
    return 0;
}

给你一个数，问你所有的划分方式，比如4，4=1+3，4=1+1+2，4=2+2，4=1+1+1+1

我们来分析一下，我们想用分治的话，就要找子问题，假设n是要划分的数，m说最大的加数，n=4，m=3

分解成两类的子问题，一个是：一个是有m的情况，一个是没有m的情况，然后将有m的情况继续划分，分

解成有m-1和没有m-1的情况，一直划分下去，直到m=1。比如n=4，m=3，划分成的子问题：有3，无

3，有2，无2，有1，无1（没有意义，除非0+4=4），将这些子问题合并起来大问题就解决了。

九、总结

分治算法的一个核心在于子问题的规模大小是否接近，如果接近则算法效率较高。

分治算法和动态规划都是解决子问题，然后对解进行合并；但是分治算法是寻找远小于原问题的子问题（因为对于计算机来说计算小数据的问题还是很快的），同时分治算法的效率并不一定好，而动态规划的效率取决于子问题的个数的多少，子问题的个数远小于子问题的总数的情况下（也就是重复子问题多），算法才会很高效。

会员力量，点亮园子希望

刷新页面返回顶部

~ C blogs ~