堆排序

直接选择排序中,为了从R[1..n]中选出关键字最小的记录,必须进行n-1次比较,然后在R[2..n]中选出关键字最小的记录,又需要做n-2次比较。

事实上,后面的n-2次比较中,有许多比较可能在前面的n-1次比较中已经做过,但由于前一趟排序时未保留这些比较结果,所以后一趟排序时又

重复执行了这些比较操作。堆排序可通过树形结构保存部分比较结果,可减少比较次数。

 

堆排序两步:1.将一个无序序列建成一个堆;2.输出堆顶元素之后,调整剩余元素为堆;

以上两步都要用“筛选”这种方法

1、 堆排序定义
     n个关键字序列Kl,K2,…,Kn称为堆,当且仅当该序列满足如下性质(简称为堆性质):
     (1) ki≤K2i且ki≤K2i+1 或(2)Ki≥K2i且ki≥K2i+1(1≤i≤ )

     若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构,则堆实质上是满足如下性质的完全二叉树:

树中任一非叶结点的关键字均不大于(或不小于)其左右孩子(若存在)结点的关键字。

 

2、用大根堆排序的基本思想
① 先将初始文件R[1..n]建成一个大根堆,此堆为初始的无序区
② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,由此得到新的无序区R[1..n-1]

    和有序区R[n],且满足R[1..n-1].keys≤R[n].key
③ 由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1..n-1]调整为堆。

然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,

由此得到新的无序区R[1..n-2]和有序区R[n-1..n],且仍满足关系R[1..n-2].keys≤R[n-1..n].keys,同样要将R[1..n-2]调整为堆。
    ……
直到无序区只有一个元素为止。

 

void HeapSort(HeapType &H)
   { //对顺序表H进行堆排序
      for( i=H.length/2;i>0;--i)

        HeapAdjust(H,i,H.length);//第一步建堆,从[n/2],开始调整,把它以下的子树都利用“筛选”调一次


      for(i=H.length;i>1;i--){ //对当前无序区R[1..i]进行堆排序,共做n-1趟。

      H[0]=H[1];H[1]=H[i];H[i]=H[0]; //H[0]做中间变量,将堆顶和堆中最后一个记录交换,则最后一个是有序的,这样又类似于选择排序,但前面那些有序将被利用。
     Heapify(H,1,i-1); //将R[1..i-1]重新调整为堆,仅有R[1]可能违反堆性质
     } //endfor
   } //HeapSort

 

3、 算法分析
     堆排序的时间,主要由建立初始堆和反复重建堆这两部分的时间开销构成,它们均是通过调用HeapAdjust实现的。
     堆排序的最坏时间复杂度为O(nlgn)。堆排序的平均性能较接近于最坏性能。
     由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
     堆排序是就地排序,辅助空间为O(1),
     它是不稳定的排序方法。

posted @ 2012-01-11 21:09  nba76ers  阅读(687)  评论(0)    收藏  举报