算法-快速排序

以整个数组为对象执行quick_sort
quick_sort流程如下:
1.将数组分成局部前后两个数组。Divide
2.对前部分数组进行quick_sort. Solve
3.对后部分数组进行quick_sort. Solve
#include<iostream> 
using namespace std; 
const int N=1000010; 
int q[N]; 
//quick_sort 
void quick_sort(int q[],int l,int r)
{ 
if(l>=r) return;
 int i=l-1,j=r+1,x=q[l+r>>1]; 
while(i<j) {
 do i++; while(q[i]<x);
 do j--; while(q[j]>x);
 if(i<j) 
swap(q[i],q[j]);
 } 
quick_sort(q,l,j);//递归前半部分数组 
quick_sort(q,j+1,r);//递归后半部分数组 
}
 int main()
{ 
int n;
 cin>>n; 
for(int i=0;i<n;i++)
 cin>>q[i]; 
quick_sort(q,o,n-1);
 for(int i=0;i<n;i++) 
cout<<q[i];
return 0;
 }

  

证明:

循环不变式:q[l..i] <= x     q[j..r] >= x

1.初始化

循环开始之前i = l - 1, j = r + 1。则q[l..i],q[j..r]为空,循环不变式显然成立。

2.保持

假设某轮循环开始前循环不变式成立,即q[l..i] <= x, q[j..r] >= x。
执行循环体 do i++; while(q[i] < x);
会使得 q[l..i-1] <= x, q[i] >= x;
do j--; while(q[j] > x);
会使得 q[j+1..r] >= x, q[j] <= x;
if(i < j) swap(q[i], q[j]);
会使得 q[l..i] <= x, q[j..r] >= x
所以,i和j更新之后,下一次循环开始之前,循环不变式依然成立。
注意:由于使用do-while循环,所以i和j一定会!!!自增!!!
使得循环会继续下去, 但是如果采用while循环(i和j的初始化做出对应的变更),i和j在特殊情况下不自增的话, 循环就会卡死。
例如: while(q[i] < x) i++; while(q[j] > x) j--;
当q[i]和q[j]都为 x 时, i 和 j 都不会更新,导致 while 陷入死循环。

3.终止

循环结束时,i >= j。 正常情况下,按照循环不变式,我们应该会觉得结果已经显然了。
因为i >= j,q[l..i] <= x, q[j..r] >= x,所以按照j来划分的话, q[l..j] <= x, q[j+1..r] >= x是显然的。
可是,最后一轮循环有点特殊,因为最后一轮循环的if语句一定不会执行。
因为最后一轮循环一定满足 i >= j,不然不会跳出while循环的,所以if语句一定不执行。
正确分析: 由于最后一轮的if语句一定不执行,所以,只能保证
i >= j和q[l..i-1] <= x, q[i] >= x和q[j+1..r] >= x, q[j] <= x 由q[l..i-1] <= x,i >= j(i-1 >= j-1) 和 q[j] <= x 可以得到 q[l..j] <= x 又因为q[j+1..r] >= x 。
所以,q[l..j] <= x,q[j+1..r] >= x,问题得证。
总结:
只有最后一轮循环结束时,循环不变式不成立,其余的循环都是成立的 ,但最终要求的问题还是解决了
注意:循环结束时要记得检查是否存在数组越界/无限递归的情况 所以还需要证明j最终的取值范围是[l..r-1](即不存在n划分成0和n的无限递归情况)。

4.边界情况分析

快排属于分治算法,最怕的就是 n分成0和n,或 n分成n和0,这会造成无限划分。
以j为划分时,x不能选q[r] (若以i为划分,则x不能选q[l]) 假设 x = q[r];
关键句子quick_sort(q, l, j), quick_sort(q, j + 1, r); 由于j的最小值是l,所以q[j+1..r]不会造成无限划分。
但q[l..j](即quick_sort(q, l, j))却可能造成无限划分,因为j可能为r。
举例来说,若x选为q[r],数组中q[l..r-1] < x, 那么这一轮循环结束时i = r, j = r,显然会造成无限划分。
do i++; while(q[i] < x)和do j--; while(q[j] > x)不能用q[i] <= x 和 q[j] >= x;
假设q[l..r]全相等,则执行完do i++; while(q[i] <= x);之后,i会自增到r+1。
然后继续执行q[i] <= x 判断条件,造成数组下标越界(但这貌似不会报错) 并且如果之后的q[i] <= x (此时i > r) 条件也不幸成立, 就会造成一直循环下去(亲身实验),造成内存超限(Memory Limit Exceeded)。
if(i < j) swap(q[i], q[j])能否使用 i <= j 可以使用if(i <= j) swap(q[i], q[j]); 因为 i = j 时,交换一下q[i],q[j] 无影响,因为马上就会跳出循环了 。
最后一句能否改用quick_sort(q, l, j-1), quick_sort(q, j, r)作为划分(用i做划分时也是同样的道理,)
不能
根据之前的证明,最后一轮循环可以得到这些结论 j <= i 和 q[l..i-1] <= x, q[i] >= x 和 q[j+1..r] >= x, q[j] <= x
所以,q[l..j-1] <= x 是显然成立的,但quick_sort(q, j, r)中的q[j] 却是 q[j] <= x,这不符合快排的要求 另外一点,注意quick_sort(q, l, j-1), quick_sort(q, j, r)可能会造成无线划分。
当x选为q[l]时会造成无限划分,报错为(MLE),如果手动改为 x = q[r],可以避免无限划分。
但是上面所说的q[j] <= x 的问题依然不能解决,这会造成 WA (Wrong Answer) j的取值范围为[l..r-1]
证明:
假设 j 最终的值为 r
说明只有一轮循环(两轮的话 j 至少会自减两次)
说明q[r] <= x (因为要跳出do-while循环)
说明 i >= r(while循环的结束条件), i 为 r 或 r + 1(必不可能成立) 说明 i 自增到了 r
说明 q[r] >= x 和 q[l..r-1] < x,
得出 q[r] = x 和 q[l..r-1] < x 的结论,
但这与 x = q[l + r >> 1]矛盾 。
反证法得出 j < r 假设 j 可能小于 l 说明 q[l..r] > x ,矛盾。
反证法得出 j >= l 所以 j的取值范围为[l..r-1],不会造成无限划分和数组越界。

练习题:

查找第k个小数
#include <iostream> 
using namespace std; 
const int N = 1000010;
 int q[N]; 
int quick_sort(int q[], int l, int r, int k) 
{ 
if (l >= r) return q[l];
int i = l - 1, j = r + 1, x = q[l + r >> 1];
 while (i < j) { 
do i ++ ; while (q[i] < x); 
do j -- ; while (q[j] > x);
 if (i < j) 
swap(q[i], q[j]); 
} 
if (j - l + 1 >= k) 
return quick_sort(q, l, j, k);
else return quick_sort(q, j + 1, r, k - (j - l + 1));
}
 int main() 
{
int n, k;
scanf("%d%d", &n, &k); 
for (int i = 0; i < n; i ++ ) 
scanf("%d", &q[i]); 
cout << quick_sort(q, 0, n - 1, k) << endl; 
return 0;
 }

  

posted @ 2022-03-07 14:13  六角小研  阅读(118)  评论(0)    收藏  举报