♪(^∇^*)我要当大佬，(#^.^#)哈哈哈哈，(。-ω-)zzz我要成为优秀的人，(*^▽^*)٩(๑>◡<๑)۶O(∩_∩)O哈哈~~~~~~~~欢迎━(*｀∀´*)ノ亻!

# 基础的排序算法

## c++基础

 int *generateRandomArray(int n, int rangeL, int rangeR) {

assert(rangeL <= rangeR);

int *arr = new int[n];

srand(time(NULL));
for (int i = 0; i < n; i++)
arr[i] = rand() % (rangeR - rangeL + 1) + rangeL;
return arr;
}


int *generateNearlyOrderedArray(int n, int swapTimes){

int *arr = new int[n];
for(int i = 0 ; i < n ; i ++ )
arr[i] = i;

srand(time(NULL));
for( int i = 0 ; i < swapTimes ; i ++ ){
int posx = rand()%n;
int posy = rand()%n;
swap( arr[posx] , arr[posy] );
}

return arr;
}


 int *copyIntArray(int a[], int n){

int *arr = new int[n];
//* 在VS中, copy函数被认为是不安全的,此时可用for循环:)
copy(a, a+n, arr);
return arr;
}


template<typename T>
void printArray(T arr[], int n) {

for (int i = 0; i < n; i++)
cout << arr[i] << " ";
cout << endl;

return;
}


    template<typename T>
bool isSorted(T arr[], int n) {

for (int i = 0; i < n - 1; i++)
if (arr[i] > arr[i + 1])
return false;

return true;
}


 template<typename T>
void testSort(const string &sortName, void (*sort)(T[], int), T arr[], int n) {

clock_t startTime = clock();
sort(arr, n);
clock_t endTime = clock();

assert(isSorted(arr, n));
cout << sortName << " : " << double(endTime - startTime) / CLOCKS_PER_SEC << " s" << endl;

return;
}


## 选择排序

template<typename T>
void selectionSort(T arr[], int n){

for(int i = 0 ; i < n ; i ++){

int minIndex = i;
for( int j = i + 1 ; j < n ; j ++ )
if( arr[j] < arr[minIndex] )
minIndex = j;

swap( arr[i] , arr[minIndex] );
}
}


int main() {

// 测试模板函数，传入整型数组
int a[10] = {10,9,8,7,6,5,4,3,2,1};
selectionSort( a , 10 );
for( int i = 0 ; i < 10 ; i ++ )
cout<<a[i]<<" ";
cout<<endl;

// 测试模板函数，传入浮点数数组
float b[4] = {4.4,3.3,2.2,1.1};
selectionSort(b,4);
for( int i = 0 ; i < 4 ; i ++ )
cout<<b[i]<<" ";
cout<<endl;

// 测试模板函数，传入字符串数组
string c[4] = {"D","C","B","A"};
selectionSort(c,4);
for( int i = 0 ; i < 4 ; i ++ )
cout<<c[i]<<" ";
cout<<endl;

return 0;
}


template<typename T>
void selectionSort(T arr[], int n){

int left = 0, right = n - 1;
while(left < right){
int minIndex = left;
int maxIndex = right;

// 在每一轮查找时, 要保证arr[minIndex] <= arr[maxIndex]
if(arr[minIndex] > arr[maxIndex])
swap(arr[minIndex], arr[maxIndex]);

for(int i = left + 1 ; i < right; i ++)
if(arr[i] < arr[minIndex])
minIndex = i;
else if(arr[i] > arr[maxIndex])
maxIndex = i;

swap(arr[left], arr[minIndex]);
swap(arr[right], arr[maxIndex]);

left ++;
right --;
}

return;
}


## 插入排序

template<typename T>
void insertionSort(T arr[], int n){

for( int i = 1 ; i < n ; i ++ ) {

// 寻找元素arr[i]合适的插入位置
// 写法1
//        for( int j = i ; j > 0 ; j-- )
//            if( arr[j] < arr[j-1] )
//                swap( arr[j] , arr[j-1] );
//            else
//                break;

// 写法2
for( int j = i ; j > 0 && arr[j] < arr[j-1] ; j -- )
swap( arr[j] , arr[j-1] );

}

return;
}


template<typename T>
void insertionSort(T arr[], int n){

for( int i = 1 ; i < n ; i ++ ) {

T e = arr[i];
int j; // j保存元素e应该插入的位置
for (j = i; j > 0 && arr[j-1] > e; j--)
arr[j] = arr[j-1];
arr[j] = e;
}

return;
}


## 冒泡排序

template<typename T>
void bubbleSort( T arr[] , int n){

bool swapped;

do{
swapped = false;
for( int i = 1 ; i < n ; i ++ )
if( arr[i-1] > arr[i] ){
swap( arr[i-1] , arr[i] );
swapped = true;

}

// 优化, 每一趟Bubble Sort都将最大的元素放在了最后的位置
// 所以下一次排序, 最后的元素可以不再考虑
n --;

}while(swapped);
}


template<typename T>
void bubbleSort2( T arr[] , int n){

int newn; // 使用newn进行优化

do{
newn = 0;
for( int i = 1 ; i < n ; i ++ )
if( arr[i-1] > arr[i] ){
swap( arr[i-1] , arr[i] );

// 记录最后一次的交换位置,在此之后的元素在下一轮扫描中均不考虑
newn = i;
}
n = newn;
}while(newn > 0);
}


## 希尔排序

template<typename T>
void shellSort(T arr[], int n){

// 计算 increment sequence: 1, 4, 13, 40, 121, 364, 1093...
int h = 1;
while( h < n/3 )
h = 3 * h + 1;

while( h >= 1 ){

// h-sort the array
for( int i = h ; i < n ; i ++ ){

// 对 arr[i], arr[i-h], arr[i-2*h], arr[i-3*h]... 使用插入排序
T e = arr[i];
int j;
for( j = i ; j >= h && e < arr[j-h] ; j -= h )
arr[j] = arr[j-h];
arr[j] = e;
}

h /= 3;
}
}


Selection Sort : 0.517969 s
Insertion Sort : 0.267192 s
Bubble Sort : 1.9947 s
Shell Sort : 0.003899 s


## 归并排序

// 将arr[l...mid]和arr[mid+1...r]两部分进行归并
template<typename  T>
void __merge(T arr[], int l, int mid, int r){

//* VS不支持动态长度数组, 即不能使用 T aux[r-l+1]的方式申请aux的空间
//* 使用VS, 可以使用new的方式申请aux空间
//* 使用new申请空间, 不要忘了在__merge函数的最后, delete掉申请的空间:)
T aux[r-l+1];
//T *aux = new T[r-l+1];

for( int i = l ; i <= r; i ++ )
aux[i-l] = arr[i];

// 初始化，i指向左半部分的起始索引位置l；j指向右半部分起始索引位置mid+1
int i = l, j = mid+1;
for( int k = l ; k <= r; k ++ ){

if( i > mid ){  // 如果左半部分元素已经全部处理完毕
arr[k] = aux[j-l]; j ++;
}
else if( j > r ){  // 如果右半部分元素已经全部处理完毕
arr[k] = aux[i-l]; i ++;
}
else if( aux[i-l] < aux[j-l] ) {  // 左半部分所指元素 < 右半部分所指元素
arr[k] = aux[i-l]; i ++;
}
else{  // 左半部分所指元素 >= 右半部分所指元素
arr[k] = aux[j-l]; j ++;
}
}

//delete[] aux;
}

// 递归使用归并排序,对arr[l...r]的范围进行排序
template<typename T>
void __mergeSort(T arr[], int l, int r){

if( l >= r )
return;

int mid = (l+r)/2;
__mergeSort(arr, l, mid);
__mergeSort(arr, mid+1, r);
__merge(arr, l, mid, r);
}

template<typename T>
void mergeSort(T arr[], int n){

__mergeSort( arr , 0 , n-1 );
}


// 使用优化的归并排序算法, 对arr[l...r]的范围进行排序
template<typename T>
void __mergeSort2(T arr[], int l, int r){

// 优化2: 对于小规模数组, 使用插入排序
if( r - l <= 15 ){
insertionSort(arr, l, r);
return;
}

int mid = (l+r)/2;
__mergeSort2(arr, l, mid);
__mergeSort2(arr, mid+1, r);

// 优化1: 对于arr[mid] <= arr[mid+1]的情况,不进行merge
// 对于近乎有序的数组非常有效,但是对于一般情况,有一定的性能损失
if( arr[mid] > arr[mid+1] )
__merge(arr, l, mid, r);
}

template<typename T>
void mergeSort2(T arr[], int n){

__mergeSort2( arr , 0 , n-1 );
}


// 将arr[l...mid]和arr[mid+1...r]两部分进行归并
// 其中aux为完成merge过程所需要的辅助空间
template<typename  T>
void __merge2(T arr[], T aux[], int l, int mid, int r){

// 由于aux的大小和arr一样, 所以我们也不需要处理aux索引的偏移量
// 进一步节省了计算量:)
for( int i = l ; i <= r; i ++ )
aux[i] = arr[i];

// 初始化，i指向左半部分的起始索引位置l；j指向右半部分起始索引位置mid+1
int i = l, j = mid+1;
for( int k = l ; k <= r; k ++ ){

if( i > mid ){  // 如果左半部分元素已经全部处理完毕
arr[k] = aux[j]; j ++;
}
else if( j > r ){  // 如果右半部分元素已经全部处理完毕
arr[k] = aux[i]; i ++;
}
else if( aux[i] < aux[j] ) {  // 左半部分所指元素 < 右半部分所指元素
arr[k] = aux[i]; i ++;
}
else{  // 左半部分所指元素 >= 右半部分所指元素
arr[k] = aux[j]; j ++;
}
}

}

// 使用优化的归并排序算法, 对arr[l...r]的范围进行排序
// 其中aux为完成merge过程所需要的辅助空间
template<typename T>
void __mergeSort2(T arr[], T aux[], int l, int r){

// 对于小规模数组, 使用插入排序
if( r - l <= 15 ){
insertionSort(arr, l, r);
return;
}

int mid = (l+r)/2;
__mergeSort2(arr, aux, l, mid);
__mergeSort2(arr, aux, mid+1, r);

// 对于arr[mid] <= arr[mid+1]的情况,不进行merge
// 对于近乎有序的数组非常有效,但是对于一般情况,有一定的性能损失
if( arr[mid] > arr[mid+1] )
__merge2(arr, aux, l, mid, r);
}

template<typename T>
void mergeSort2(T arr[], int n){

// 在 mergeSort2中, 我们一次性申请aux空间,
// 并将这个辅助空间以参数形式传递给完成归并排序的各个子函数
T *aux = new T[n];

__mergeSort2( arr , aux, 0 , n-1 );

delete[] aux;   // 使用C++, new出来的空间不要忘记释放掉:)
}


Merge Sort 2 只开辟了一次辅助空间, 之后将这个辅助空间以参数形式传递给完成归并排序的其他子函数,Merge Sort 2的性能优于 Merge Sort

template <typename T>
void mergeSortBU(T arr[], int n){

// Merge Sort Bottom Up 无优化版本
for( int sz = 1; sz < n ; sz += sz )
for( int i = 0 ; i < n - sz ; i += sz+sz )
// 对 arr[i...i+sz-1] 和 arr[i+sz...i+2*sz-1] 进行归并
__merge(arr, i, i+sz-1, min(i+sz+sz-1,n-1) );

}


template <typename T>
void mergeSortBU(T arr[], int n){

// Merge Sort Bottom Up 优化
// 对于小数组, 使用插入排序优化
for( int i = 0 ; i < n ; i += 16 )
insertionSort(arr,i,min(i+15,n-1));

for( int sz = 16; sz < n ; sz += sz )
for( int i = 0 ; i < n - sz ; i += sz+sz )
// 对于arr[mid] <= arr[mid+1]的情况,不进行merge
if( arr[i+sz-1] > arr[i+sz] )
__merge(arr, i, i+sz-1, min(i+sz+sz-1,n-1) );

}


Merge Sort BU 也是一个O(nlogn)复杂度的算法，虽然只使用两重for循环,所以，Merge Sort BU也可以在1秒之内轻松处理100万数量级的数据,注意：不要轻易根据循环层数来判断算法的复杂度，Merge Sort BU就是一个反例

## 快速排序

// 对arr[l...r]部分进行partition操作
// 返回p, 使得arr[l...p-1] < arr[p] ; arr[p+1...r] > arr[p]
template <typename T>
int __partition(T arr[], int l, int r){

T v = arr[l];

int j = l; // arr[l+1...j] < v ; arr[j+1...i) > v
for( int i = l + 1 ; i <= r ; i ++ )
if( arr[i] < v ){
j ++;
swap( arr[j] , arr[i] );
}

swap( arr[l] , arr[j]);

return j;
}

// 对arr[l...r]部分进行快速排序
template <typename T>
void __quickSort(T arr[], int l, int r){

if( l >= r )
return;

int p = __partition(arr, l, r);
__quickSort(arr, l, p-1 );
__quickSort(arr, p+1, r);
}

template <typename T>
void quickSort(T arr[], int n){

__quickSort(arr, 0, n-1);
}


template <typename T>
int _partition(T arr[], int l, int r){

// 随机在arr[l...r]的范围中, 选择一个数值作为标定点pivot
swap( arr[l] , arr[rand()%(r-l+1)+l] );

T v = arr[l];
int j = l;
for( int i = l + 1 ; i <= r ; i ++ )
if( arr[i] < v ){
j ++;
swap( arr[j] , arr[i] );
}

swap( arr[l] , arr[j]);

return j;
}

// 对arr[l...r]部分进行快速排序
template <typename T>
void _quickSort(T arr[], int l, int r){

// 对于小规模数组, 使用插入排序进行优化
if( r - l <= 15 ){
insertionSort(arr,l,r);
return;
}

int p = _partition(arr, l, r);
_quickSort(arr, l, p-1 );
_quickSort(arr, p+1, r);
}

template <typename T>
void quickSort(T arr[], int n){

srand(time(NULL));
_quickSort(arr, 0, n-1);
}


// 双路快速排序的partition
// 返回p, 使得arr[l...p-1] <= arr[p] ; arr[p+1...r] >= arr[p]
// 双路快排处理的元素正好等于arr[p]的时候要注意，详见下面的注释：）
template <typename T>
int _partition2(T arr[], int l, int r){

// 随机在arr[l...r]的范围中, 选择一个数值作为标定点pivot
swap( arr[l] , arr[rand()%(r-l+1)+l] );
T v = arr[l];

// arr[l+1...i) <= v; arr(j...r] >= v
int i = l+1, j = r;
while( true ){
// 注意这里的边界, arr[i] < v, 不能是arr[i] <= v
while( i <= r && arr[i] < v )
i ++;

// 注意这里的边界, arr[j] > v, 不能是arr[j] >= v
while( j >= l+1 && arr[j] > v )
j --;

// 对于上面的两个边界的设定, 有的同学在课程的问答区有很好的回答:)

if( i > j )
break;

swap( arr[i] , arr[j] );
i ++;
j --;
}

swap( arr[l] , arr[j]);

return j;
}

// 对arr[l...r]部分进行快速排序
template <typename T>
void _quickSort(T arr[], int l, int r){

// 对于小规模数组, 使用插入排序进行优化
if( r - l <= 15 ){
insertionSort(arr,l,r);
return;
}

// 调用双路快速排序的partition
int p = _partition2(arr, l, r);
_quickSort(arr, l, p-1 );
_quickSort(arr, p+1, r);
}

template <typename T>
void quickSort(T arr[], int n){

srand(time(NULL));
_quickSort(arr, 0, n-1);
}


// 递归的三路快速排序算法
template <typename T>
void __quickSort3Ways(T arr[], int l, int r){

// 对于小规模数组, 使用插入排序进行优化
if( r - l <= 15 ){
insertionSort(arr,l,r);
return;
}

// 随机在arr[l...r]的范围中, 选择一个数值作为标定点pivot
swap( arr[l], arr[rand()%(r-l+1)+l ] );

T v = arr[l];

int lt = l;     // arr[l+1...lt] < v
int gt = r + 1; // arr[gt...r] > v
int i = l+1;    // arr[lt+1...i) == v
while( i < gt ){
if( arr[i] < v ){
swap( arr[i], arr[lt+1]);
i ++;
lt ++;
}
else if( arr[i] > v ){
swap( arr[i], arr[gt-1]);
gt --;
}
else{ // arr[i] == v
i ++;
}
}

swap( arr[l] , arr[lt] );

__quickSort3Ways(arr, l, lt-1);
__quickSort3Ways(arr, gt, r);
}

template <typename T>
void quickSort3Ways(T arr[], int n){

srand(time(NULL));
__quickSort3Ways( arr, 0, n-1);
}


## 逆序数对(归并排序)

// 计算逆序数对的结果以long long返回
// 对于一个大小为N的数组, 其最大的逆序数对个数为 N*(N-1)/2, 非常容易产生整型溢出

// merge函数求出在arr[l...mid]和arr[mid+1...r]有序的基础上, arr[l...r]的逆序数对个数
long long __merge( int arr[], int l, int mid, int r){

int *aux = new int[r-l+1];
for( int i = l ; i <= r ; i ++ )
aux[i-l] = arr[i];

// 初始化逆序数对个数 res = 0
long long res = 0;
// 初始化，i指向左半部分的起始索引位置l；j指向右半部分起始索引位置mid+1
int j = l, k = mid + 1;
for( int i = l ; i <= r ; i ++ ){
if( j > mid ){ // 如果左半部分元素已经全部处理完毕
arr[i] = aux[k-l];
k ++;
}
else if( k > r ){ // 如果右半部分元素已经全部处理完毕
arr[i] = aux[j-l];
j ++;
}
else if( aux[j-l] <= aux[k-l] ){ // 左半部分所指元素 <= 右半部分所指元素
arr[i] = aux[j-l];
j ++;
}
else{ // 右半部分所指元素 < 左半部分所指元素
arr[i] = aux[k-l];
k ++;
// 此时, 因为右半部分k所指的元素小
// 这个元素和左半部分的所有未处理的元素都构成了逆序数对
// 左半部分此时未处理的元素个数为 mid - j + 1
res += (long long)(mid - j + 1);
}
}

delete[] aux;

return res;
}

// 求arr[l..r]范围的逆序数对个数
// 思考: 归并排序的优化可否用于求逆序数对的算法? :)
long long __inversionCount(int arr[], int l, int r){

if( l >= r )
return 0;

int mid = l + (r-l)/2;

// 求出 arr[l...mid] 范围的逆序数
long long res1 = __inversionCount( arr, l, mid);
// 求出 arr[mid+1...r] 范围的逆序数
long long res2 = __inversionCount( arr, mid+1, r);

return res1 + res2 + __merge( arr, l, mid, r);
}

// 递归求arr的逆序数对个数
long long inversionCount(int arr[], int n){

return __inversionCount(arr, 0, n-1);
}


## 寻找arr数组中第k小的元素(快速排序)

main.cpp

#include <iostream>
#include <ctime>
#include <cassert>
#include <algorithm>
#include "TestHelper.h"

using namespace std;

// partition 过程, 和快排的partition一样
template <typename T>
int __partition( T arr[], int l, int r ){

int p = rand()%(r-l+1) + l;
swap( arr[l] , arr[p] );

int j = l; //[l+1...j] < p ; [lt+1..i) > p
for( int i = l + 1 ; i <= r ; i ++ )
if( arr[i] < arr[l] )
swap(arr[i], arr[++j]);

swap(arr[l], arr[j]);

return j;
}

// 求出arr[l...r]范围里第k小的数
template <typename T>
T __selection( T arr[], int l, int r, int k ){

if( l == r )
return arr[l];

// partition之后, arr[p]的正确位置就在索引p上
int p = __partition( arr, l, r );

if( k == p )    // 如果 k == p, 直接返回arr[p]
return arr[p];
else if( k < p )    // 如果 k < p, 只需要在arr[l...p-1]中找第k小元素即可
return __selection( arr, l, p-1, k);
else // 如果 k > p, 则需要在arr[p+1...r]中找第k-p-1小元素
// 注意: 由于我们传入__selection的依然是arr, 而不是arr[p+1...r],
//       所以传入的最后一个参数依然是k, 而不是k-p-1
return __selection( arr, p+1, r, k );
}

// 寻找arr数组中第k小的元素
// 注意: 在我们的算法中, k是从0开始索引的, 即最小的元素是第0小元素, 以此类推
// 如果希望我们的算法中k的语意是从1开始的, 只需要在整个逻辑开始进行k--即可, 可以参考selection2
template <typename T>
T selection(T arr[], int n, int k) {

assert( k >= 0 && k < n );

srand(time(NULL));
return __selection(arr, 0, n - 1, k);
}

// 寻找arr数组中第k小的元素, k从1开始索引, 即最小元素是第1小元素, 以此类推
template <typename T>
T selection2(T arr[], int n, int k) {

return selection(arr, n, k - 1);
}

// 测试 selection算法
int main() {

// 生成一个大小为n, 包含0...n-1这n个元素的随机数组arr
int n = 10000;
int* arr = TestHelper::generateOrderedArray(n);
TestHelper::shuffleArray(arr, n);

// 验证selection算法, 对arr数组求第i小元素, 应该为i
for( int i = 0 ; i < n ; i ++ ){
assert( selection(arr, n, i) == i );
cout<<"test "<<i<<" complete."<<endl;
}
cout<<"Test selection completed."<<endl;

delete[] arr;

cout << endl;

// 验证selection2算法
arr = TestHelper::generateOrderedArray(n);
TestHelper::shuffleArray(arr, n);

// 对arr数组求第i小元素, 应该为i - 1 (在selection2中, 第k小元素的k是从1索引的)
for( int i = 1 ; i <= n ; i ++ ){
assert( selection2(arr, n, i) == i - 1 );
cout<<"test "<<i<<" complete."<<endl;
}
cout<<"Test selection2 completed."<<endl;

delete[] arr;

return 0;
}


TestHelper.h


#ifndef OPTIONAL_3_SELECTION_TESTHELPER_H
#define OPTIONAL_3_SELECTION_TESTHELPER_H

#include <iostream>
#include <algorithm>
#include <ctime>

using namespace std;

namespace TestHelper {

// 生成一个完全有序的数组
int *generateOrderedArray(int n) {

int *arr = new int[n];
for (int i = 0; i < n; i++)
arr[i] = i;

return arr;
}

// 将数组arr随机化
void shuffleArray(int arr[], int n){

srand(time(NULL));
for (int i = 0; i < n; i++) {
int j = rand() % (n-i)+i;
swap( arr[i], arr[j]);
}
}
}
#endif //OPTIONAL_3_SELECTION_TESTHELPER_H



## 总结

Merge Sort BU 比 Merge Sort 快一些。但优化后, 二者的性能差距不明显，

Shell Sort虽然慢于高级的排序方式, 但仍然是非常有竞争力的一种排序算法，其所花费的时间完全在可以容忍的范围内, 远不像O(n^2)的排序算法, 在数据量较大的时候无法忍受，同时, Shell Sort实现简单, 只使用循环的方式解决排序问题, 不需要实现递归, 不占用系统占空间, 也不依赖随机数，所以, 如果算法实现所使用的环境不利于实现复杂的排序算法, 或者在项目工程的测试阶段, 完全可以暂时使用Shell Sort来进行排序任务:)

posted @ 2020-04-15 22:37  跌倒的小黄瓜  阅读(213)  评论(0编辑  收藏  举报