内部排序总结之----插入类排序（插入和Shell） - 简志睿

公告

内部排序总结之----插入类排序（插入和Shell）

一、直接插入排序

　　直接插入排序(straight insertion sort)的做法是：

　　每次从无序表中取出第一个元素，把它插入到有序表的合适位置，使有序表仍然有序。

　　第一趟比较前两个数，然后把第二个数按大小插入到有序表中；第二趟把第三个数据与前两个数从后向前扫描，把第三个数按大小插入到有序表中；依次进行下去，进行了(n-1)趟扫描以后就完成了整个排序过程。

准备待排数组｛-1,12,3,44｝

第1趟：｛-1,12,3,44｝

第2趟：｛-1,3,12,44｝

第3趟：｛-1,3,12,44｝

　　直接插入排序是由两层嵌套循环组成的。外层循环标识并决定待比较的数值。内层循环为待比较数值确定其最终位置。直接插入排序是将待比较的数值与它的前一个数值进行比较，所以外层循环是从第二个数值开始的。当前一数值比待比较数值大的情况下继续循环比较，直到找到比待比较数值小的并将待比较数值置入其后一位置，结束该次循环。

　　插入排序的基本方法是：每步将一个待排序的记录按其关键字的大小插到前面已经排序的序列中的适当位置，直到全部记录插入完毕为止。

 1 void insertSort(int arr[],int len)
 2 {
 3     int i,j;                                      
 4     for(i = 1; i < len; ++i)
 5     {
 6         for(j = i; j > 0 && arr[j] < arr[j-1]; --j)//j为待排序序列头部
 7         {
 8             int tmp = arr[j];
 9             arr[j] = arr[j-1];
10             arr[j-1] = tmp;
11         }
12     }
13 }

　　直接插入排序总结：

时间复杂度：平均情况O(n²)，最好情况O(n)，最坏情况O(n²)

空间复杂度：O(1)

稳定性：稳定

　　直接插入排序较为简单，一笔带过，我们下面看看另一种优化的插入排序---Shell排序。

二、Shell排序

　　观察一下”插入排序“：其实不难发现它有个缺点：

　　如果当数据是“5, 4, 3, 2, 1”的时候，此时我们将“待排序序列”中的记录插入到“有序序列”时，每次比较都要挪动数据，此时插入排序的效率可想而知。

　　shell根据这个弱点进行了算法改进，融入了一种叫做“缩小增量排序法”的思想，其实也蛮简单的，不过有点注意的就是：增量不是乱取，而是有规律可循的。

　　d=3时：将40跟50比，因50大，不交换。

将20跟30比，因30大，不交换。

将80跟60比，因60小，交换。

d=2时：将40跟60比，不交换，拿60跟30比交换，此时交换后的30又比前面的40小，又要将40和30交换，如上图。

将20跟50比，不交换，继续将50跟80比，不交换。

d=1时：这时就是前面讲的插入排序了，不过此时的序列已经差不多有序了，所以给插入排序带来了很大的性能提高。

　　插入类排序的特点就是：越有序越快。

#include <stdio.h>

void Shell(int arr[],int arr_len,int dk)
{
    int i,j;
　　//此时dk就是一个单位长度，相当于直接插入排序中的1

    for(i = dk; i < arr_len; ++i)
    {
        for(j = i - dk; j >= 0 && arr[j+dk] < arr[j]; j -=dk)
        {
            int tmp = arr[j+dk];
            arr[j+dk] = arr[j];
            arr[j] = tmp;
        }
    }
}

void ShellSort(int arr[],int arr_len,int dka[],int dka_len)//分组
{
    int i;
    for (i = 0; i < dka_len; i++)
    {
        Shell(arr,arr_len,dka[i]);
    }
}

void Show(int arr[],int len)
{
    for(int i = 0; i < len; i++)
    {
        printf("%d ",arr[i]);
    }
    printf("\n");

}
int main ()
{
    int arr[] = {-1,12,3,44,3,52,6,23,43,32,24,67,5,10,1,21};
    int dk[] = {5,3,1};
    int len = sizeof(arr)/sizeof(arr[0]);
    int lenDk = sizeof(dk)/sizeof(dk[0]);

    printf("before：\n");
    Show(arr,len);
    ShellSort(arr,len,dk,lenDk);
    printf("after：\n");
    Show(arr,len);
    return 0;
}

那么如何选取关键字呢?就是分成三组,一组,这个分组的依据是什么呢?为什么不是二组,六组或者其它组嘞?

增量序列的共同特征:

① 最后一个增量必须为1（如果最后一个增量不为1，会出现有数据没有参加排序）

② 应该尽量避免序列中的值(尤其是相邻的值)互为倍数的情况（如果为倍数，相当于，后面的排序再重复之前的行为）

Shell排序总结：

时间复杂度：平均情况O(n^1.3)，最好情况O(n),最坏情况O(n²)

空间复杂度：O(1)

稳定性：不稳定

优劣：

　　Shell排序不需要大量的辅助空间，和归并排序一样容易实现。Shell排序是基于插入排序的一种算法，在此算法基础之上增加了一个新的特性，提高了效率。Shell排序的时间复杂度与增量序列的选取有关，例如Shell增量时间复杂度为O(n²)，而Hibbard增量的Shell排序的时间复杂度为O(

)，Shell排序时间复杂度的下界是n*log2n。Shell排序没有快速排序算法快 O(n(logn))，因此中等大小规模表现良好，对规模非常大的数据排序不是最优选择。但是比O(

)复杂度的算法快得多。并且Shell排序非常容易实现，算法代码短而简单。此外，Shell算法在最坏的情况下和平均情况下执行效率相差不是很多，与此同时快速排序在最坏的情况下执行的效率会非常差。专家们提倡，几乎任何排序工作在开始时都可以用Shell排序，若在实际使用中证明它不够快，再改成快速排序这样更高级的排序算法. 本质上讲，Shell排序算法是直接插入排序算法的一种改进，减少了其复制的次数，速度要快很多。原因是，当n值很大时数据项每一趟排序需要移动的个数很少，但数据项的距离很长。当n值减小时每一趟需要移动的数据增多，此时已经接近于它们排序后的最终位置。正是这两种情况的结合才使Shell排序效率比插入排序高很多。Shell算法的性能与所选取的分组长度序列有很大关系。只对特定的待排序记录序列，可以准确地估算关键词的比较次数和对象移动次数。想要弄清关键词比较次数和记录移动次数与增量选择之间的关系，并给出完整的数学分析，至今仍然是数学难题。

posted on 2017-10-21 20:12 简志睿阅读(354) 评论(0) 收藏举报

刷新页面返回顶部

Jian_99

公告

优劣：