排序算法
排序算法的介绍
排序算法(Sort Algorithm),是指将一种数据,按照指定的规则进行排序的过程
排序算法的分类
- 内部排序法:指将需要处理的所有数据都加载到内部存储器(内存)中进行排序
- 外部排序法:数据量过大,无法全部加载到内存中,需要借助外部存储(文件等)进行排序
- 常见的排序算法分类如下图

算法的时间复杂度和空间复杂度
时间复杂度
度量一个程序(算法)执行时间的两种方法
- 事后统计:这种方法可行,但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快
- 事前估算的方法:通过分析某个算法的时间复杂度来判断哪个算法更优.
时间频度
- 基本介绍:一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为\(T(n)\)
- 举例说明:比如计算1-100 所有数字之和, 我们设计两种算法:
//第一种算法
//T(n)=n+1
int total = 0;
int end = 100;
for (int i = 1; i <= end; i++) {
total += i;
}
//第二种算法
//T(n)=1
total = (1 + end) * end / 2;
- 结论:在讨论时间复杂度时,可以忽略常数项、忽略低次项、忽略系数
时间复杂度
- 一般情况下,算法中的基本操作语句的重复执行次数是问题规模\(n\)的某个函数,用\(T(n)\)表示,若有某个辅助函数\(f(n)\),使得当\(n\)趋近于无穷大时,\(\frac{T(n)}{f(n)}\)的极限值为不等于零的常数,则称\(f(n)\)是\(T(n)\)的同数量级函数。记作\(T(n)=O(f(n))\),称\(O( f(n) )\)为算法的渐进时间复杂度,简称时间复杂度
- \(T(n)\)不同,但时间复杂度可能相同。如:\(T(n)=n²+7n+6\)与\(T(n)=3n²+2n+2\)它们的\(T(n)\)不同,但时间复杂度相同,都为\(O(n²)\)
- 计算时间复杂度的方法:
- 用常数1代替运行时间中的所有加法常数\(T(n)=n²+7n+6 \Rightarrow T(n)=n²+7n+1\)
- 修改后的运行次数函数中,只保留最高阶项\(T(n)=n²+7n+1\Rightarrow T(n) = n²\)
- 去除最高阶项的系数\(T(n) = n² \Rightarrow T(n) = n² \Rightarrow O(n²)\)
常见的时间复杂度
- 常数阶:\(O(1)\)
- 对数阶:\(O(\log_2n)\)
- 线性阶:\(O(n)\)
- 线性对数阶:\(O(n\log_2n)\)
- 平方阶:\(O(n^2)\)
- 立方阶:\(O(n^3)\)
- k次方阶:\(O(n^k)\)
- 指数阶:\(O(2^n)\)
常见的时间复杂度对应的图:

说明:
- 常见的算法时间复杂度由小到大依次为:\(Ο(1)<Ο(\log_2n)<Ο(n)<Ο(n\log_2n)<Ο(n^2)<Ο(n^3)< Ο(n^k) <Ο(2^n)\),随着问题规模\(n\)的不断增大,上述时间复杂度不断增大,算法的执行效率越低
- 从图中可见,我们应该尽可能避免使用指数阶的算法
常见时间复杂度对应的代码举例
常数阶\(O(1)\)
无论代码执行了多少行,只要没有循环等复杂结构,那这个代码的时间复杂度就是\(O(1)\)
int i = 1;
int j = 2;
++i;
j++;
int m = i + j;
说明:上面代码在执行的时候,它消耗的时间并不随这某个变量的增长而增长,那么无论这类代码有多长,即使有几万几十万行,都可以用\(O(1)\)来表示其时间复杂度
对数阶\(O(\log_2n)\)
int i = 1;
while (i < n) {
i = i * 2;
}
说明:在while循环中,每次都将i乘以2,乘完之后,i距离就越来越近了。假设循环x次之后,i就大于2了,此时这个循环就退出了,也就是说\(x=\log_2n\),即循环\(\log_2n\)之后,这个代码就结束了。因此这个代码的时间复杂度为:\(O(\log_2n)\)。\(O(\log_2n)\)这个时间复杂度时根据代码来变化的,对于更新表达式\(i=i*3\),则是\(O(\log_3n)\)
线性阶\(O(n)\)
for (i = 1; i <= n; i++) {
j = i;
j++
}
说明:这段代码,for循环里面的代码会执行n遍,因此其消耗的时间随着n的变化而线性变化,所以这类代码的时间复杂度为:\(O(n)\)
线性对数阶\(O)(n\log_2n)\)
for (m = 1; m < n; m++) {
i = 1;
while (i < n) {
i = i * 2;
}
}
说明:线性对数阶就是将时间复杂度为\(O(\log_2n)\)的代码循环n遍,其时间复杂度就为\(n \times O(log_2n)\),即\(O(n\log_2n)\)
平方阶\(O(n^2)\)
for (int i = 0; i <= n; i++) {
for (int j = 0; j <= n; j++) {
k = 1;
k++;
}
}
说明:平方阶就是把时间复杂度为\(O(n)\)的代码在嵌套循环一遍,其时间复杂度就为\(O(n^2)\),实际上这段代码就是一个2层嵌套for循环。如果把其中一层循环的n改成m,其时间复杂度就变成了:\(O(mn)\)
立方阶、k次方阶
同平方阶:k层嵌套for循环的时间复杂度就为立方阶
平均时间复杂度和最坏时间复杂度
- 平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间
- 最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长
- 平均时间复杂度和最坏时间复杂度是否一致,和算法有关:
| 排序法 | 平均时间 | 最差情形 | 稳定度 | 额外空间 | 备注 |
|---|---|---|---|---|---|
| 冒泡 | \(O(n^2)\) | \(O(n^2)\) | 稳定 | \(O(1)\) | n小时较好 |
| 交换 | \(O(n^2)\) | \(O(n^2)\) | 不稳定 | \(O(1)\) | n小时较好 |
| 选择 | \(O(n^2)\) | \(O(n^2)\) | 不稳定 | \(O(1)\) | n小时较好 |
| 插入 | \(O(n^2)\) | \(O(n^2)\) | 稳定 | \(O(1)\) | 大部分已排序时较好 |
| 基数 | \(O(\log_RB)\) | \(O(\log_RB)\) | 稳定 | \(O(n)\) | B是真数(0~9),R是基数 |
| 希尔 | \(O(n\log_2n)\) | \(O(n^s)1<s<2\) | 不稳定 | \(O(1)\) | s是所选分组 |
| 快速 | \(O(n\log_2n)\) | \(O(n^2)\) | 不稳定 | \(O(n\log_2n)\) | n大时较好 |
| 归并 | \(O(n\log_2n)\) | \(O(n\log_2n)\) | 稳定 | \(O(1)\) | n大时较好 |
| 堆 | \(O(n\log_2n)\) | \(O(n\log_2n)\) | 不稳定 | \(O(1)\) | n大时较好 |
空间复杂度简介
基本介绍:
- 类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模 的函数
- 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当较大时,将占用较多的存储单元,例如快速排序和归并排序算法,基数排序就属于这种情况
- 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间
八种排序算法
冒泡排序
冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端
算法描述
对待排序序列从前向后进行扫描,依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部。第一趟扫描结束,最后一个元素即为值最大的元素,第二趟扫描不难扫描最后一个元素。重复以上步骤,直至序列有序
优化策略:排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,说明序列有序,因此要在排序过程中设置一个标志flag判断元素是否进行过交换,从而减少不必要的比较
动画演示

代码实现
public static void bubbleSort(int[] array) {
int temp = 0;
boolean flag = false;
for (int i = 0; i < array.length - 1; i++) {
for (int j = 0; j < array.length -1 - i; j++) {
// 如果前面的数比后面的数大,则交换
if (array[j] > array[j + 1]) {
flag = true;
temp = array[j];
array[j] = array[j + 1];
array[j + 1] = temp;
}
}
if (!flag) { // 在一趟排序中,一次交换都没有发生过,这时说明序列已有序,直接结束
break;
} else {
flag = true; // 重置flag!!!, 进行下次判断
}
}
}
void bubbleSort(int[] array, int n) {
int temp = 0;
bool flag = false;
for (int i = 0; i < n - 1; i++) {
for (int j = 0; j < n -1 - i; j++) {
// 如果前面的数比后面的数大,则交换
if (array[j] > array[j + 1]) {
flag = true;
temp = array[j];
array[j] = array[j + 1];
array[j + 1] = temp;
}
}
if (!flag) { // 在一趟排序中,一次交换都没有发生过,这时说明序列已有序,直接结束
break;
} else {
flag = false; // 重置flag!!!, 进行下次判断
}
}
}
选择排序
选择排序(Selection-sort)是一种简单直观的排序算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。
算法描述
第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列
动图演示

代码实现
public static void selectSort(int* array) {
int minIndex;
int min;
for (int i = 0; i < array.length - 1; i++) {
minIndex = i;
min = array[minIndex];
for (int j = i + 1; j < array.length; j ++) {
if (array[j] < min) {
minIndex = j;
min = array[minIndex];
}
}
//若minIndex == i,说明这一次扫描得到的最小值就是array[i],无需交换
if (minIndex != i) {
array[minIndex] = array[i];
array[i] = min;
}
}
}
void selectSort(int* array, int n) {
int minIndex;
int min;
for (int i = 0; i < n - 1; i++) {
minIndex = i;
min = array[minIndex];
for (int j = i + 1; j < n; j ++) {
if (array[j] < min) {
minIndex = j;
min = array[minIndex];
}
}
//若minIndex == i,说明这一次扫描得到的最小值就是array[i],无需交换
if (minIndex != i) {
array[minIndex] = array[i];
array[i] = min;
}
}
}
插入排序
插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的
算法描述
插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表
算法图解

动画演示

代码实现
public static void insertSort(int[] array) {
int insertIndex;
int insertValue;
for (int i = 1; i < array.length; i++) {
insertIndex = i - 1; //指向要插入的位置
insertValue = array[i]; //待插入的数
//insertIndex >= 0是为防止数组下标越界
//满足array[insertIndex] > insertValue的数组元素要后移
while (insertIndex >= 0 && array[insertIndex] > insertValue) {
array[insertIndex + 1] = array[insertIndex];
insertIndex--;//将insertIndex前移
}
//为了减少不必要的插入,只有当insertIndex发生过前移才插入
if (insertIndex + 1 != i) {
array[insertIndex + 1] = insertValue;
}
}
}
void insertSort(int* array, int n) {
int insertIndex;
int insertValue;
for (int i = 1; i < n; i++) {
insertIndex = i - 1; //指向要插入的位置
insertValue = array[i]; //待插入的数
//insertIndex >= 0是为防止数组下标越界
//满足array[insertIndex] > insertValue的数组元素要后移
while (insertIndex >= 0 && array[insertIndex] > insertValue) {
array[insertIndex + 1] = array[insertIndex];
insertIndex--;//将insertIndex前移
}
//为了减少不必要的插入,只有当insertIndex发生过前移才插入
if (insertIndex + 1 != i) {
array[insertIndex + 1] = insertValue;
}
}
}
希尔排序
我们看简单的插入排序可能存在的问题:
数组arr = {2,3,4,5,6,1}这时需要插入的数1(最小),过程是这样的:
-
{2,3,4,5,6,6} -
{2,3,4,5,5,6} -
{2,3,4,4,5,6} -
{2,3,3,4,5,6} -
{2,2,3,4,5,6} -
{1,2,3,4,5,6}
结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响
希尔排序是希尔(Donald Shell)于1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序
算法描述
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含
的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止
算法图解

动画演示

代码实现
public static void shellSort(int[] array) {
for (int gap = array.length / 2; gap > 0; gap /= 2) {
for (int i = gap; i < array.length; i++) {
int j = i; //指向带插入的位置的后一个相差一个步长的位置
int temp = array[j]; //待插入的值
if (array[j] < array[j - gap]) { //如果array[j] > array[j - gap]说明array[j]不需要插入
while (j - gap >= 0 && temp < array[j - gap]) {
array[j] = array[j - gap];
j -= gap;
}
array[j] = temp;
}
}
}
}
void shellSort(int* array, int n) {
for (int gap = n / 2; gap > 0; gap /= 2) {
for (int i = gap; i < n; i++) {
int j = i; //指向带插入的位置的后一个相差一个步长的位置
int temp = array[j]; //待插入的值
if (array[j] < array[j - gap]) { //如果array[j] > array[j - gap]说明array[j]不需要插入
while (j - gap >= 0 && temp < array[j - gap]) {
array[j] = array[j - gap];
j -= gap;
}
array[j] = temp;
}
}
}
}
快速排序
快速排序(Quicksort)是对冒泡排序的一种改进。
算法描述
通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列
算法图解

动画演示

代码实现
public static void quickSort(int[] array, int left, int right) {
int l = left;
int r = right;
int pivot = array[(left + right) / 2]; //记录处于数组中间位置的数据
int temp; //临时变量,做交换时用
while (l < r) {
while (array[l] < pivot) {
l++;
}
while (array[r] > pivot) {
r--;
}
// 当l == r时说明处于pivot左边的数已全部小于pivot,处于pivot右边位置的数已全部大于pivot
if (l == r) {
break;
}
//交换
temp = array[l];
array[l] = array[r];
array[r] = temp;
//以下两个判断语句实际上只用写一个
if (array[l] == pivot) {
r--;
}
if (array[r] == pivot) {
l++;
}
}
if (r == l) {
r--;
l++;
}
//向左递归
if (left < r) {
quickSort(array, left, r);
}
//向右递归
if (right > l) {
quickSort(array, l, right);
}
}
void quickSort(int* array, int left, int right) {
int l = left;
int r = right;
int pivot = array[(left + right) / 2]; //记录处于数组中间位置的数据
int temp; //临时变量,做交换时用
while (l < r) {
while (array[l] < pivot) {
l++;
}
while (array[r] > pivot) {
r--;
}
// 当l == r时说明处于pivot左边的数已全部小于pivot,处于pivot右边位置的数已全部大于pivot
if (l == r) {
break;
}
//交换
temp = array[l];
array[l] = array[r];
array[r] = temp;
//以下两个判断语句实际上只用写一个
if (array[l] == pivot) {
r--;
}
if (array[r] == pivot) {
l++;
}
}
if (r == l) {
r--;
l++;
}
//向左递归
if (left < r) {
quickSort(array, left, r);
}
//向右递归
if (right > l) {
quickSort(array, l, right);
}
}
归并排序
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)
策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修
补"在一起,即分而治之)
算法描述
- 把长度为n的输入序列分成两个长度为n/2的子序列;
- 对这两个子序列分别采用归并排序;
- 将两个排序好的子序列合并成一个最终的排序序列。
算法图解


动画演示

代码实现
//分+合的方法
public static void mergeSort(int[] array, int left, int right, int[] temp) {
if (left < right) {
int mid = (left + right) / 2; //记录中轴元素
mergeSort(array, left, mid, temp); //向左递归
mergeSort(array, mid + 1, right, temp); //向右递归
merge(array, left, mid, right, temp); //合并
}
}
//合并的方法
public static void merge(int[] array, int left, int mid, int right, int[] temp) {
int i = left; //记录左边有序序列的开始位置
int j = mid + 1; //记录右边有序序列的开始位置
int t = 0; //指向temp数组的当前索引
//先把左右两边(有序)的数据按照规则填充到temp数组
//直到左右两边的有序序列,有一边处理完毕为止
while (i <= mid && j <= right) {
//如果左边的有序序列的当前元素,小于等于右边有序序列的当前元素
//即将左边的当前元素,填充到temp数组
//然后 t++, i++
if (array[i] <= array[j]) {
temp[t++] = array[i++];
} else {
temp[t++] = array[j++];
}
}
//把有剩余数据的一边的数据依次全部填充到temp
while (i <= mid) {//左边的有序序列还有剩余的元素,就全部填充到temp
temp[t++] = array[i++];
}
while (j <= right) {//右边的有序序列还有剩余的元素,就全部填充到temp
temp[t++] = array[j++];
}
//将temp数组的元素拷贝到arr
//注意,并不是每次都拷贝所有
t = 0;
int tempLeft = left;
while (tempLeft <= right) {
array[tempLeft++] = temp[t++];
}
}
//分+合的方法
void mergeSort(int* array, int left, int right, int* temp) {
if (left < right) {
int mid = (left + right) / 2; //记录中轴元素
mergeSort(array, left, mid, temp); //向左递归
mergeSort(array, mid + 1, right, temp); //向右递归
merge(array, left, mid, right, temp); //合并
}
}
//合并的方法
void merge(int* array, int left, int mid, int right, int* temp) {
int i = left; //记录左边有序序列的开始位置
int j = mid + 1; //记录右边有序序列的开始位置
int t = 0; //指向temp数组的当前索引
//先把左右两边(有序)的数据按照规则填充到temp数组
//直到左右两边的有序序列,有一边处理完毕为止
while (i <= mid && j <= right) {
//如果左边的有序序列的当前元素,小于等于右边有序序列的当前元素
//即将左边的当前元素,填充到temp数组
//然后 t++, i++
if (array[i] <= array[j]) {
temp[t++] = array[i++];
} else {
temp[t++] = array[j++];
}
}
//把有剩余数据的一边的数据依次全部填充到temp
while (i <= mid) {//左边的有序序列还有剩余的元素,就全部填充到temp
temp[t++] = array[i++];
}
while (j <= right) {//右边的有序序列还有剩余的元素,就全部填充到temp
temp[t++] = array[j++];
}
//将temp数组的元素拷贝到arr
//注意,并不是每次都拷贝所有
t = 0;
int tempLeft = left;
while (tempLeft <= right) {
array[tempLeft++] = temp[t++];
}
}
基数排序
基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾
名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用
算法描述
将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。
这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列
算法图解

动画演示

代码实现
public static void radixSort(int array) {
//1. 获取数组元素的最大位数
int max = array[0];
for (int i = 1; i < array.length; i++) {
if (array[i] > max) {
max = array[i];
}
}
int maxLength = ("" + max).length(); //存储数组元素最大位数的变量
int[][] bucket = new int[10][array.length]; //表示桶的二维数组
int[] bucketElementCounts = new int[10]; //记录桶中元素个数的数组
//排序算法的最外层循环次数为 maxLength
for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
//把数据放入桶中
for (int j = 0; j < array.length; j++) {
int digitOfElement = array[j] / n % 10; //获取数据的某一位的上的数据
bucket[digitOfElement][bucketElementCounts[digitOfElement]++] = array[j]; //放入桶中
}
// 从桶中取出数据
int index = 0;
for (int k = 0; k < bucketElementCounts.length; k++) {
if (bucketElementCounts[k] != 0) {
for (int l = 0; l < bucketElementCounts[k]; l++) {
array[index++] = bucket[k][l];
}
}
bucketElementCounts[k] = 0; //当一个桶的数据全部被取出之后,要将记录其元素个数的变量赋值为0
}
}
}

浙公网安备 33010602011771号