Loading

排序算法

排序算法的介绍

排序算法(Sort Algorithm),是指将一种数据,按照指定的规则进行排序的过程

排序算法的分类

  1. 内部排序法:指将需要处理的所有数据都加载到内部存储器(内存)中进行排序
  2. 外部排序法:数据量过大,无法全部加载到内存中,需要借助外部存储(文件等)进行排序
  3. 常见的排序算法分类如下图

常见的排序算法分类

算法的时间复杂度和空间复杂度

时间复杂度

度量一个程序(算法)执行时间的两种方法

  1. 事后统计:这种方法可行,但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快
  2. 事前估算的方法:通过分析某个算法的时间复杂度来判断哪个算法更优.

时间频度

  • 基本介绍:一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为\(T(n)\)
  • 举例说明:比如计算1-100 所有数字之和, 我们设计两种算法:
//第一种算法
//T(n)=n+1
int total = 0;
int end = 100;
for (int i = 1; i <= end; i++) {
    total += i;
}

//第二种算法
//T(n)=1
total = (1 + end) * end / 2;
  • 结论:在讨论时间复杂度时,可以忽略常数项、忽略低次项、忽略系数

时间复杂度

  1. 一般情况下,算法中的基本操作语句的重复执行次数是问题规模\(n\)的某个函数,用\(T(n)\)表示,若有某个辅助函数\(f(n)\),使得当\(n\)趋近于无穷大时,\(\frac{T(n)}{f(n)}\)的极限值为不等于零的常数,则称\(f(n)\)\(T(n)\)的同数量级函数。记作\(T(n)=O(f(n))\),称\(O( f(n) )\)为算法的渐进时间复杂度,简称时间复杂度
  2. \(T(n)\)不同,但时间复杂度可能相同。如:\(T(n)=n²+7n+6\)\(T(n)=3n²+2n+2\)它们的\(T(n)\)不同,但时间复杂度相同,都为\(O(n²)\)
  3. 计算时间复杂度的方法:
    • 用常数1代替运行时间中的所有加法常数\(T(n)=n²+7n+6 \Rightarrow T(n)=n²+7n+1\)
    • 修改后的运行次数函数中,只保留最高阶项\(T(n)=n²+7n+1\Rightarrow T(n) = n²\)
    • 去除最高阶项的系数\(T(n) = n² \Rightarrow T(n) = n² \Rightarrow O(n²)\)

常见的时间复杂度

  1. 常数阶:\(O(1)\)
  2. 对数阶:\(O(\log_2n)\)
  3. 线性阶:\(O(n)\)
  4. 线性对数阶:\(O(n\log_2n)\)
  5. 平方阶:\(O(n^2)\)
  6. 立方阶:\(O(n^3)\)
  7. k次方阶:\(O(n^k)\)
  8. 指数阶:\(O(2^n)\)

常见的时间复杂度对应的图:

常见的时间复杂度对应的图

说明:

  1. 常见的算法时间复杂度由小到大依次为:\(Ο(1)<Ο(\log_2n)<Ο(n)<Ο(n\log_2n)<Ο(n^2)<Ο(n^3)< Ο(n^k) <Ο(2^n)\),随着问题规模\(n\)的不断增大,上述时间复杂度不断增大,算法的执行效率越低
  2. 从图中可见,我们应该尽可能避免使用指数阶的算法

常见时间复杂度对应的代码举例

常数阶\(O(1)\)

无论代码执行了多少行,只要没有循环等复杂结构,那这个代码的时间复杂度就是\(O(1)\)

int i = 1;
int j = 2;
++i;
j++;
int m = i + j;

说明:上面代码在执行的时候,它消耗的时间并不随这某个变量的增长而增长,那么无论这类代码有多长,即使有几万几十万行,都可以用\(O(1)\)来表示其时间复杂度

对数阶\(O(\log_2n)\)
int i = 1;
while (i < n) {
    i = i * 2;
}

说明:在while循环中,每次都将i乘以2,乘完之后,i距离就越来越近了。假设循环x次之后,i就大于2了,此时这个循环就退出了,也就是说\(x=\log_2n\),即循环\(\log_2n\)之后,这个代码就结束了。因此这个代码的时间复杂度为:\(O(\log_2n)\)\(O(\log_2n)\)这个时间复杂度时根据代码来变化的,对于更新表达式\(i=i*3\),则是\(O(\log_3n)\)

线性阶\(O(n)\)
for (i = 1; i <= n; i++) {
    j = i;
    j++
}

说明:这段代码,for循环里面的代码会执行n遍,因此其消耗的时间随着n的变化而线性变化,所以这类代码的时间复杂度为:\(O(n)\)

线性对数阶\(O)(n\log_2n)\)
for (m = 1; m < n; m++) {
    i = 1;
    while (i < n) {
        i = i * 2;
    }
}

说明:线性对数阶就是将时间复杂度为\(O(\log_2n)\)的代码循环n遍,其时间复杂度就为\(n \times O(log_2n)\),即\(O(n\log_2n)\)

平方阶\(O(n^2)\)
for (int i = 0; i <= n; i++) {
    for (int j = 0; j <= n; j++) {
        k = 1;
        k++;
    }
}

说明:平方阶就是把时间复杂度为\(O(n)\)的代码在嵌套循环一遍,其时间复杂度就为\(O(n^2)\),实际上这段代码就是一个2层嵌套for循环。如果把其中一层循环的n改成m,其时间复杂度就变成了:\(O(mn)\)

立方阶、k次方阶

同平方阶:k层嵌套for循环的时间复杂度就为立方阶

平均时间复杂度和最坏时间复杂度

  1. 平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间
  2. 最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长
  3. 平均时间复杂度和最坏时间复杂度是否一致,和算法有关:
排序法 平均时间 最差情形 稳定度 额外空间 备注
冒泡 \(O(n^2)\) \(O(n^2)\) 稳定 \(O(1)\) n小时较好
交换 \(O(n^2)\) \(O(n^2)\) 不稳定 \(O(1)\) n小时较好
选择 \(O(n^2)\) \(O(n^2)\) 不稳定 \(O(1)\) n小时较好
插入 \(O(n^2)\) \(O(n^2)\) 稳定 \(O(1)\) 大部分已排序时较好
基数 \(O(\log_RB)\) \(O(\log_RB)\) 稳定 \(O(n)\) B是真数(0~9),R是基数
希尔 \(O(n\log_2n)\) \(O(n^s)1<s<2\) 不稳定 \(O(1)\) s是所选分组
快速 \(O(n\log_2n)\) \(O(n^2)\) 不稳定 \(O(n\log_2n)\) n大时较好
归并 \(O(n\log_2n)\) \(O(n\log_2n)\) 稳定 \(O(1)\) n大时较好
\(O(n\log_2n)\) \(O(n\log_2n)\) 不稳定 \(O(1)\) n大时较好

空间复杂度简介

基本介绍:

  1. 类似于时间复杂度的讨论,一个算法的空间复杂度(Space Complexity)定义为该算法所耗费的存储空间,它也是问题规模 的函数
  2. 空间复杂度(Space Complexity)是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当较大时,将占用较多的存储单元,例如快速排序和归并排序算法,基数排序就属于这种情况
  3. 在做算法分析时,主要讨论的是时间复杂度。从用户使用体验上看,更看重的程序执行的速度。一些缓存产品(redis, memcache)和算法(基数排序)本质就是用空间换时间

八种排序算法

冒泡排序

冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端

算法描述

对待排序序列从前向后进行扫描,依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部。第一趟扫描结束,最后一个元素即为值最大的元素,第二趟扫描不难扫描最后一个元素。重复以上步骤,直至序列有序

优化策略:排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,说明序列有序,因此要在排序过程中设置一个标志flag判断元素是否进行过交换,从而减少不必要的比较

动画演示

代码实现

public static void bubbleSort(int[] array) {
    int temp = 0;
    boolean flag = false;
    for (int i = 0; i < array.length - 1; i++) {
        for (int j = 0; j < array.length -1 - i; j++) {
            // 如果前面的数比后面的数大,则交换
            if (array[j] > array[j + 1]) {
                flag = true;
               	temp = array[j];
                array[j] = array[j + 1];
                array[j + 1] = temp;
            }
        }
        if (!flag) { // 在一趟排序中,一次交换都没有发生过,这时说明序列已有序,直接结束
            break;
        } else {
            flag = true; // 重置flag!!!, 进行下次判断
        }
    }
}
void bubbleSort(int[] array, int n) {
    int temp = 0;
    bool flag = false;
    for (int i = 0; i < n - 1; i++) {
        for (int j = 0; j < n -1 - i; j++) {
            // 如果前面的数比后面的数大,则交换
            if (array[j] > array[j + 1]) {
                flag = true;
               	temp = array[j];
                array[j] = array[j + 1];
                array[j + 1] = temp;
            }
        }
        if (!flag) { // 在一趟排序中,一次交换都没有发生过,这时说明序列已有序,直接结束
            break;
        } else {
            flag = false; // 重置flag!!!, 进行下次判断
        }
    }
}

选择排序

选择排序(Selection-sort)是一种简单直观的排序算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

算法描述

第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列

动图演示

代码实现

public static void selectSort(int* array) {
    int minIndex;
    int min;
    for (int i = 0; i < array.length - 1; i++) {
        minIndex = i;
        min = array[minIndex];
        for (int j = i + 1; j < array.length; j ++) {
            if (array[j] < min) {
                minIndex = j;
                min = array[minIndex];
            }
        }
        //若minIndex == i,说明这一次扫描得到的最小值就是array[i],无需交换
        if (minIndex != i) {
            array[minIndex] = array[i];
            array[i] = min;
        }
    }
}
void selectSort(int* array, int n) {
    int minIndex;
    int min;
    for (int i = 0; i < n - 1; i++) {
        minIndex = i;
        min = array[minIndex];
        for (int j = i + 1; j < n; j ++) {
            if (array[j] < min) {
                minIndex = j;
                min = array[minIndex];
            }
        }
        //若minIndex == i,说明这一次扫描得到的最小值就是array[i],无需交换
        if (minIndex != i) {
            array[minIndex] = array[i];
            array[i] = min;
        }
    }
}

插入排序

插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的

算法描述

插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表

算法图解

插入排序图解

动画演示

代码实现

public static void insertSort(int[] array) {
    int insertIndex;
    int insertValue;
    for (int i = 1; i < array.length; i++) {
        insertIndex = i - 1;	//指向要插入的位置
        insertValue = array[i];	//待插入的数
        //insertIndex >= 0是为防止数组下标越界
        //满足array[insertIndex] > insertValue的数组元素要后移
        while (insertIndex >= 0 && array[insertIndex] > insertValue) {
            array[insertIndex + 1] = array[insertIndex];
            insertIndex--;//将insertIndex前移
        }
        //为了减少不必要的插入,只有当insertIndex发生过前移才插入
        if (insertIndex + 1 != i) {
            array[insertIndex + 1] = insertValue;
        }
	}
}
void insertSort(int* array, int n) {
    int insertIndex;
    int insertValue;
    for (int i = 1; i < n; i++) {
        insertIndex = i - 1;	//指向要插入的位置
        insertValue = array[i];	//待插入的数
        //insertIndex >= 0是为防止数组下标越界
        //满足array[insertIndex] > insertValue的数组元素要后移
        while (insertIndex >= 0 && array[insertIndex] > insertValue) {
            array[insertIndex + 1] = array[insertIndex];
            insertIndex--;//将insertIndex前移
        }
        //为了减少不必要的插入,只有当insertIndex发生过前移才插入
        if (insertIndex + 1 != i) {
            array[insertIndex + 1] = insertValue;
        }
	}
}

希尔排序

我们看简单的插入排序可能存在的问题:
数组arr = {2,3,4,5,6,1}这时需要插入的数1(最小),过程是这样的:

  • {2,3,4,5,6,6}

  • {2,3,4,5,5,6}

  • {2,3,4,4,5,6}

  • {2,3,3,4,5,6}

  • {2,2,3,4,5,6}

  • {1,2,3,4,5,6}

结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响

希尔排序是希尔(Donald Shell)于1959 年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序

算法描述

希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含
的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止

算法图解

希尔排序图解

动画演示

代码实现

public static void shellSort(int[] array) {
    for (int gap = array.length / 2; gap > 0; gap /= 2) {
        for (int i = gap; i < array.length; i++) {
            int j = i;	//指向带插入的位置的后一个相差一个步长的位置
            int temp = array[j]; //待插入的值
            if (array[j] < array[j - gap]) {	//如果array[j] > array[j - gap]说明array[j]不需要插入
                while (j - gap >= 0 && temp < array[j - gap]) {
                    array[j] = array[j - gap];
                    j -= gap;
            	}
           	 	array[j] = temp;
            }
        }
    }
}
void shellSort(int* array, int n) {
    for (int gap = n / 2; gap > 0; gap /= 2) {
        for (int i = gap; i < n; i++) {
            int j = i;	//指向带插入的位置的后一个相差一个步长的位置
            int temp = array[j]; //待插入的值
            if (array[j] < array[j - gap]) {	//如果array[j] > array[j - gap]说明array[j]不需要插入
                while (j - gap >= 0 && temp < array[j - gap]) {
                    array[j] = array[j - gap];
                    j -= gap;
            	}
           	 	array[j] = temp;
            }
        }
    }
}

快速排序

快速排序(Quicksort)是对冒泡排序的一种改进。

算法描述

通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列

算法图解

动画演示

代码实现

public static void quickSort(int[] array, int left, int right) {
    int l = left;	
    int r = right;	
    int pivot = array[(left + right) / 2];	//记录处于数组中间位置的数据
    int temp;	//临时变量,做交换时用
    while (l < r) {
        while (array[l] < pivot) {
            l++;
        }
        
        while (array[r] > pivot) {
            r--;
        }
        
        // 当l == r时说明处于pivot左边的数已全部小于pivot,处于pivot右边位置的数已全部大于pivot
        if (l == r) {
            break;
        }
        
        //交换
        temp = array[l];
        array[l] = array[r];
        array[r] = temp;
        
        //以下两个判断语句实际上只用写一个
        if (array[l] == pivot) {
            r--;
        }
        
        if (array[r] == pivot) {
            l++;
        }
    }
    
    if (r == l) {
        r--;
        l++;
    }
    //向左递归
    if (left < r) {
        quickSort(array, left, r);
    }
    //向右递归
    if (right > l) {
        quickSort(array, l, right);
    }
}
void quickSort(int* array, int left, int right) {
    int l = left;	
    int r = right;	
    int pivot = array[(left + right) / 2];	//记录处于数组中间位置的数据
    int temp;	//临时变量,做交换时用
    while (l < r) {
        while (array[l] < pivot) {
            l++;
        }
        
        while (array[r] > pivot) {
            r--;
        }
        
        // 当l == r时说明处于pivot左边的数已全部小于pivot,处于pivot右边位置的数已全部大于pivot
        if (l == r) {
            break;
        }
        
        //交换
        temp = array[l];
        array[l] = array[r];
        array[r] = temp;
        
        //以下两个判断语句实际上只用写一个
        if (array[l] == pivot) {
            r--;
        }
        
        if (array[r] == pivot) {
            l++;
        }
    }
    
    if (r == l) {
        r--;
        l++;
    }
    //向左递归
    if (left < r) {
        quickSort(array, left, r);
    }
    //向右递归
    if (right > l) {
        quickSort(array, l, right);
    }
}

归并排序

归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)
策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修
补"在一起,即分而治之)

算法描述

  • 把长度为n的输入序列分成两个长度为n/2的子序列;
  • 对这两个子序列分别采用归并排序;
  • 将两个排序好的子序列合并成一个最终的排序序列。

算法图解

尚123锁

尚ava数据结构和算法-已解锁

动画演示

代码实现

//分+合的方法
public static void mergeSort(int[] array, int left, int right, int[] temp) {
    if (left < right) {
        int mid = (left + right) / 2;			//记录中轴元素
        mergeSort(array, left, mid, temp);		//向左递归
        mergeSort(array, mid + 1, right, temp);	//向右递归
        merge(array, left, mid, right, temp);	//合并
    }
}

//合并的方法
public static void merge(int[] array, int left, int mid, int right, int[] temp) {
    int i = left;		//记录左边有序序列的开始位置
    int j = mid + 1;	//记录右边有序序列的开始位置
    int t = 0;			//指向temp数组的当前索引
    //先把左右两边(有序)的数据按照规则填充到temp数组
	//直到左右两边的有序序列,有一边处理完毕为止
    while (i <= mid && j <= right) {
        //如果左边的有序序列的当前元素,小于等于右边有序序列的当前元素
		//即将左边的当前元素,填充到temp数组 
		//然后 t++, i++
        if (array[i] <= array[j]) {
            temp[t++] = array[i++];
        } else {
            temp[t++] = array[j++];
        }
    }
    
    //把有剩余数据的一边的数据依次全部填充到temp
    while (i <= mid) {//左边的有序序列还有剩余的元素,就全部填充到temp
        temp[t++] = array[i++];
    }
    
    while (j <= right) {//右边的有序序列还有剩余的元素,就全部填充到temp
        temp[t++] = array[j++];
    }
    
    //将temp数组的元素拷贝到arr
	//注意,并不是每次都拷贝所有
    t = 0;
    int tempLeft = left;
    while (tempLeft <= right) {
        array[tempLeft++] = temp[t++];
    }
}
//分+合的方法
void mergeSort(int* array, int left, int right, int* temp) {
    if (left < right) {
        int mid = (left + right) / 2;			//记录中轴元素
        mergeSort(array, left, mid, temp);		//向左递归
        mergeSort(array, mid + 1, right, temp);	//向右递归
        merge(array, left, mid, right, temp);	//合并
    }
}

//合并的方法
void merge(int* array, int left, int mid, int right, int* temp) {
    int i = left;		//记录左边有序序列的开始位置
    int j = mid + 1;	//记录右边有序序列的开始位置
    int t = 0;			//指向temp数组的当前索引
    //先把左右两边(有序)的数据按照规则填充到temp数组
	//直到左右两边的有序序列,有一边处理完毕为止
    while (i <= mid && j <= right) {
        //如果左边的有序序列的当前元素,小于等于右边有序序列的当前元素
		//即将左边的当前元素,填充到temp数组 
		//然后 t++, i++
        if (array[i] <= array[j]) {
            temp[t++] = array[i++];
        } else {
            temp[t++] = array[j++];
        }
    }
    
    //把有剩余数据的一边的数据依次全部填充到temp
    while (i <= mid) {//左边的有序序列还有剩余的元素,就全部填充到temp
        temp[t++] = array[i++];
    }
    
    while (j <= right) {//右边的有序序列还有剩余的元素,就全部填充到temp
        temp[t++] = array[j++];
    }
    
    //将temp数组的元素拷贝到arr
	//注意,并不是每次都拷贝所有
    t = 0;
    int tempLeft = left;
    while (tempLeft <= right) {
        array[tempLeft++] = temp[t++];
    }
}

基数排序

基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾
名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用

算法描述

将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。
这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列

算法图解

WPS图片编辑

动画演示

代码实现

public static void radixSort(int array) {
    //1. 获取数组元素的最大位数
    int max = array[0];
    for (int i = 1; i < array.length; i++) {
        if (array[i] > max) {
            max = array[i];
        }
    }
    
    int maxLength = ("" + max).length();	//存储数组元素最大位数的变量
    
    int[][] bucket = new int[10][array.length];		//表示桶的二维数组
    int[] bucketElementCounts = new int[10];		//记录桶中元素个数的数组
    
    //排序算法的最外层循环次数为 maxLength
    for (int i = 0, n = 1; i < maxLength; i++, n *= 10) {
        //把数据放入桶中
        for (int j = 0; j < array.length; j++) {
            int digitOfElement = array[j] / n % 10;		//获取数据的某一位的上的数据
            bucket[digitOfElement][bucketElementCounts[digitOfElement]++] = array[j];	//放入桶中
        }	
        // 从桶中取出数据
        int index = 0;
        for (int k = 0; k < bucketElementCounts.length; k++) {
            if (bucketElementCounts[k] != 0) {
                for (int l = 0; l < bucketElementCounts[k]; l++) {
                    array[index++] = bucket[k][l];
                }
            }
            bucketElementCounts[k] = 0; //当一个桶的数据全部被取出之后,要将记录其元素个数的变量赋值为0
        }
    }
}
posted @ 2021-08-24 14:27  冷梦sama  阅读(70)  评论(0)    收藏  举报