【排序】排序算法之插入排序
排序算法之插入排序
排序是数据处理中经常使用的一种重要运算,在计算机及其应用系统中,花费在排序上的时间在系统运行时间中占有很大比重,其重要性无需多言。下文将介绍常用的如下排序方法,对它们进行简单的分析和比较,并提供 C/C++ 语言实现。
所谓排序,就是要将一堆记录,使之按关键字递增(或递减)次序排列起来。根据排序所采用的策略,可以分为如上五种:
4、归并排序;
其中插入排序、交换排序、选择排序、选择排序、归并排序都是基于关键字比较的排序,比较排序的平均时间复杂度好不过 O(nlogn)。
而桶排序是基于映射的排序,其平均时间复杂度可达到 O(n),但桶排序需要额外的空间来存储经过映射的记录。
通常在待排序记录较多的时候,基于映射的排序 O(n) 比基于比较的排序 O(nlogn) 的效率要高得多,这很好理解:用空间换时间。(查找算法其实也是如此,散列查找比其他查找算法的效率要高得多)。
另外,在讨论一个排序算法的效率时,光看时间复杂度是不够的,还要看待排序记录的规模。比如说,平均时间复杂度为 O(n ^ 2) 的插入排序,冒泡排序等在待排序记录规模较小的情况下,其效率反而比平均时间复杂度为 O(nlogn) 的堆排序要好。
废话少说,下面开始简单介绍排序算法及其 C/C++ 语言实现。
插入排序(Insertion Sort)的基本思想是:每次将一个待排序的记录,按其关键字大小插入到前面已经排好序的子序列中的适当位置,直到全部记录插入完成为止。
下面介绍两种插入排序方法:直接插入排序和希尔排序。
直接插入排序
基本思想:将待排序记录分成两部分:有序部分和无序部分,逐个从无序部分中取出记录插入有序部分中的合适位置,使有序部分依然保持有序,直到无序部分为空,完成排序。
代码实现:
void insert_sort(int* array, int length)2
{3
assert(array && length >= 0);4

5
if (length <= 1) {6
return;7
}8

9
int i, j, temp;10
for (i = 1; i < length; ++i) {11
temp = array[i];12
j = i - 1;13

14
while (j >= 0 && temp < array[j]) {15
array[j + 1] = array[j];16
--j;17
}18

19
array[j + 1] = temp;20
}21
}
时间复杂度分析:
直接插入排序算法主要进行有两个操作:查找比较,移动记录,这两个操作均和记录长度 n 相关。其平均时间复杂度为 O(n ^ 2)。这在排序算法里面算慢的,但是当记录较少时,它的效率还是可以不错的。
空间复杂度分析:
直接插入排序只需要一个元素的辅助空间,用于元素的位置交换 O(1)。
补充:
直接插入排序是稳定排序。
它在元素基本有序的情况下(接近最好情况),比较和移动的次数都较少,效率是很高的。
希尔排序(Shell sort)
希尔排序是插入排序的一种,它是利用直接插入排序实现的。
基本思想:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小,通常为 1)时,再对全体元素进行一次直接插入排序。
代码实现:
void shell_sort(int* array, int length)2
{3
assert(array && length >= 0);4

5
if (length <= 1) {6
return;7
}8

9
int i, j , temp;10
int increment = length;11

12
do {13
increment = increment / 3 + 1;14

15
// 希尔排序中的一趟排序,increment 为当前增量16
// 将 [increment, length - 1] 之间的记录分别插入各组当前的有序区17
for (i = increment; i < length; ++i) {18
temp = array[i];19
j = i - increment;20

21
while (j >= 0 && temp < array[j]) {22
array[j + increment] = array[j];23
j -= increment;24
}25

26
array[j + increment] = temp;27
}28
} while (increment > 1);29
}
时间复杂度分析:
希尔排序的执行时间依赖于增量序列。如果选取好的增量序列呢,总的来说有如下两点:
① 最后一个增量必须为 1;
② 应该尽量避免序列中的值(尤其是相邻的值)互为倍数的情况,所以一般都取奇数。
希尔排序的平均时间复杂度也为 O(n ^ 2),其效率通常比直接插入排序要高,因为当增量减少到接近 1 时,序列已经基本有序了,前面分析过,直接插入排序在序列基本有序的情况下,效率是很高的。
空间复杂度分析:
直接插入排序只需要一个元素的辅助空间,用于元素的位置交换 O(1)。
补充:
希尔排序是不稳定的。
=============================================
测试代码:
typedef void (*Sort_Function)(int* array, int length);2

3
struct SortFucntionInfo {4
char * name;5
Sort_Function func;6
};7

8
SortFucntionInfo sort_function_list[] = {9
{"直接插入排序", insert_sort},10
{"希尔排序", shell_sort},11
{"", NULL}12
};13

14
void print_array(const int* a, int length, const char* prefix)15
{16
assert(a && length >= 0);17

18
if (prefix) {19
printf("%s", prefix);20
}21

22
for (int i = 0; i < length; i++) {23
printf("%d ", a[i]);24
}25

26
printf("/n");27
}28

29
void test_sort(Sort_Function func)30
{31
const int length = 11;32
const int count = 2;33
int array[count][length] = {34
{65, 32, 49, 10, 8, 72, 27, 42, 18, 58, 91},35
{10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0},36
};37
38
for (int i = 0; i < count; i++) {39
print_array(array[i], length, " original: ");40

41
func(array[i], length);42

43
print_array(array[i], length, " sorted: ");44

45
printf("/n");46
}47
}48

49
int main(int argc, const char* argv[])50
{51
for (int i = 0; sort_function_list[i].func != NULL; i++) {52
printf("/n=== %s ===/n", sort_function_list[i].name);53
test_sort(sort_function_list[i].func);54
}55

56
system("pause");57
return 0;58
}
运行结果:
=== 直接插入排序 ===
original: 65 32 49 10 8 72 27 42 18 58 91
sorted: 8 10 18 27 32 42 49 58 65 72 91
original: 10 9 8 7 6 5 4 3 2 1 0
sorted: 0 1 2 3 4 5 6 7 8 9 10
=== 希尔排序 ===
original: 65 32 49 10 8 72 27 42 18 58 91
sorted: 8 10 18 27 32 42 49 58 65 72 91
original: 10 9 8 7 6 5 4 3 2 1 0
sorted: 0 1 2 3 4 5 6 7 8 9 10



浙公网安备 33010602011771号