在二维平面上的n个点中,如何快速的找出最近的一对点,就是最近点对问题。

    一种简单的想法是暴力枚举每两个点,记录最小距离,显然,时间复杂度为O(n^2)。

    在这里介绍一种时间复杂度为O(nlognlogn)的算法。其实,这里用到了分治的思想。将所给平面上n个点的集合S分成两个子集S1和S2,每个子集中约有n/2个点。然后在每个子集中递归地求最接近的点对。在这里,一个关键的问题是如何实现分治法中的合并步骤,即由S1和S2的最接近点对,如何求得原集合S中的最接近点对。如果这两个点分别在S1和S2中,问题就变得复杂了。

    为了使问题变得简单,首先考虑一维的情形。此时,S中的n个点退化为x轴上的n个实数x1,x2,...,xn。最接近点对即为这n个实数中相差最小的两个实数。显然可以先将点排好序,然后线性扫描就可以了。但我们为了便于推广到二维的情形,尝试用分治法解决这个问题。

    假设我们用m点将S分为S1和S2两个集合,这样一来,对于所有的p(S1中的点)和q(S2中的点),有p<q。

    递归地在S1和S2上找出其最接近点对{p1,p2}和{q1,q2},并设

d = min{ |p1-p2| , |q1-q2| }

    由此易知,S中最接近点对或者是{p1,p2},或者是{q1,q2},或者是某个{q3,p3},如下图所示。



 

 

    如果最接近点对是{q3,p3},即|p3-q3|<d,则p3和q3两者与m的距离都不超过d,且在区间(m-d,d]和(d,m+d]各有且仅有一个点。这样,就可以在线性时间内实现合并。

 

    此时,一维情形下的最近点对时间复杂度为O(nlogn)。

    在二维情形下,类似的,利用分治法,但是难点在于如何实现线性的合并?



 

 

    由上图可见,形成的宽为2d的带状区间,最多可能有n个点,合并时间最坏情况下为n^2,。但是,P1和P2中的点具有以下稀疏的性质,对于P1中的任意一点,P2中的点必定落在一个d X 2d的矩形中,且最多只需检查六个点(鸽巢原理)。

 

    这样,先将带状区间的点按y坐标排序,然后线性扫描,这样合并的时间复杂度为O(nlogn),几乎为线性了。

 

    由上图可见,形成的宽为2d的带状区间,最多可能有n个点,合并时间最坏情况下为n^2,。但是,P1和P2中的点具有以下稀疏的性质,对于P1中的任意一点,P2中的点必定落在一个d X 2d的矩形中,且最多只需检查六个点(鸽巢原理)。

  若矩形R中有多于6个S中的点,则由鸽舍原理易知至少有一个δ×2δ的小矩形中有2个以上S中的点。设u,v是这样2个点,它们位于同一小矩形中,则

     因此d(u,v)≤5δ/6<δ 。这与δ的意义相矛盾。也就是说矩形R中最多只有6个S中的点。图4(b)是矩形R中含有S中的6个点的极端情形。由于这种稀疏性质,对于P1中任一点p,P2中最多只有6个点与它构成最接近点对的候选者。因此,在分治法的合并步骤中,我们最多只需要检查6×n/2=3n对候选者,而不是n2/4对候选者。这是否就意味着我们可以在O(n)时间内完成分治法的合并步骤呢?现在还不能作出这个结论,因为我们只知道对于P1中每个S1中的点p最多只需要检查P2中的6个点,但是我们并不确切地知道要检查哪6个点。为了解决这个问题,我们可以将p和P2中所有S2的点投影到垂直线l上由于能与p点一起构成最接近点对候选者的S2中点一定在矩形R中,所以它们在直线l上的投影点距p在l上投影点的距离小于δ。由上面的分析可知,这种投影点最多只有6个。因此,若将P1和P2中所有S的点按其y坐标排好序,则对P1中所有点p,对排好序的点列作一次扫描,就可以找出所有最接近点对的候选者,对P1中每一点最多只要检查P2中排好序的相继6个点。

  下面我们来分析一下算法的计算复杂性。设对于n个点的平面点集S,算法耗时T(n)。算法的第1步和第5步用了O(n)时间,第3步和第6步用了常数时间,第2步用了2T(n/2)时间。若在每次执行第4步时进行排序,则在最坏情况下第4步要用O(nlogn)时间。这不符合我们的要求。因此,在这里我们要作一个技术上的处理。我们采用设计算法时常用的预排序技术,即在使用分治法之前,预先将S中n个点依其y坐标值排好序,设排好序的点列为P*。在执行分治法的第4步时,只要对P*作一次线性扫描,即可抽取出我们所需要的排好序的点列P1*和P2*。然后,在第5步中再对P1*作一次线性扫描,即可求得δl。因此,第4步和第5步的两遍扫描合在一起只要用O(n)时间。这样一来,经过预排序处理后的算法CPAIR2所需的计算时间T(n)满足递归方程.

    显而易见T(n)=O(nlogn)预排序所需的计算时间为O(n1ogn)。因此,整个算法所需的计算时间为O(nlogn)。在渐近的意义下,此算法已是最优的了。

 

    这样,先将带状区间的点按y坐标排序,然后线性扫描,这样合并的时间复杂度为O(nlogn),几乎为线性了。

 

    光说不练也不行,经过自己的思考和参考网上的程序,完成了最近点对的程序,并在各OJ上成功AC了。

 

/**  
最近点对问题,时间复杂度为O(n*logn)  
*/  
#include <iostream>   
#include <cstdio>   
#include <cstring>   
#include <cmath>   
#include <algorithm>   
using namespace std;   
const double INF = 1e20;   
const int N = 100005;   
 
struct Point   
{   
    double x;   
    double y;   
}point[N];   
int n;   
int tmpt[N];   
  
bool cmpxy(const Point& a, const Point& b)   
{   
    if(a.x != b.x)   
       return a.x < b.x;   
    return a.y < b.y;   
}   
  
bool cmpy(const int& a, const int& b)   
{   
    return point[a].y < point[b].y;   
}   

double min(double a, double b)   
{   
    return a < b ? a : b;   
}   
  
double dis(int i, int j)   
{   
    return sqrt((point[i].x-point[j].x)*(point[i].x-point[j].x)   
                + (point[i].y-point[j].y)*(point[i].y-point[j].y));   
}   
  
double Closest_Pair(int left, int right)   
{   
    double d = INF;   
    if(left==right)   
        return d;   
    if(left + 1 == right)   
        return dis(left, right);   
    int mid = (left+right)>>1;   
    double d1 = Closest_Pair(left,mid);   
    double d2 = Closest_Pair(mid+1,right);   
    d = min(d1,d2);   
    int i,j,k=0;   
    //分离出宽度为d的区间   
    for(i = left; i <= right; i++)   
    {   
        if(fabs(point[mid].x-point[i].x) <= d)   
            tmpt[k++] = i;   
    }   
    sort(tmpt,tmpt+k,cmpy);   
    //线性扫描   
    for(i = 0; i < k; i++)   
    {   
        for(j = i+1; j < k && point[tmpt[j]].y-point[tmpt[i]].y<d; j++)   
        {   
            double d3 = dis(tmpt[i],tmpt[j]);   
            if(d > d3)   
                d = d3;   
        }   
    }   
    return d;   
}   
  
  
int main()   
{   
    while(true)   
    {   
        scanf("%d",&n);   
        if(n==0)   
            break;   
        for(int i = 0; i < n; i++)   
            scanf("%lf %lf",&point[i].x,&point[i].y);   
        sort(point,point+n,cmpxy);   
        printf("%.2lf\n",Closest_Pair(0,n-1)/2);   
    }   
    return 0;   
}  

 

   

 

 

posted on 2012-12-10 10:28  王国龙  阅读(1939)  评论(0)    收藏  举报