算法导论读书笔记（7）

快速排序

快速排序是一种原地排序算法，对包含 n 个数的输入数组，最坏情况运行时间为 Θ ( n² )。虽然这个最坏情况运行时间比较差，但快速排序通常是用于排序的最佳的实用选择。这是因为其平均性能相当好：期望的运行时间为 Θ ( n lg n )，且 Θ ( n lg n )记号中隐含的常数因子很小。

像合并排序一样，快速排序也是基于分治模式的。下面是对一个子数组 A [ p .. r ]排序的分治过程的三个步骤：

分解：: 数组 A [ p .. r ]被划分成两个（可能为空）子数组 A [ p .. q - 1 ]和 A [ q + 1 .. r ]，使得 A [ p .. q - 1 ]中的每一个元素都小于等于 A [ q ]，而且，小于等于 A [ q + 1 .. r ]中的元素。下标 q 也在这个划分过程中计算。
解决：: 通过递归调用快速排序，对子数组 A [ p .. q - 1 ]和 A [ q + 1 .. r ]排序。
合并：: 因为两个子数组是就地排序的，将它们合并不需要操作，整个数组 A [ p .. r ]已排序。

下面的过程实现了快速排序：

QUICK-SORT(A, p, r)
1 if p < r
2     q = PARTITION(A, p, r)
3     QUICK-SORT(A, p, q - 1)
4     QUICK-SORT(A, q + 1, r)

快速排序算法的关键是 PARTITION 过程，它对子数组 A [ p .. r ]进行就地重排：

PARTITION(A, p, r)
1 x = A[r]
2 i = p - 1
3 for j = p to r - 1
4     if A[j] <= x
5         i = i + 1
6         exchange A[i] with A[j]
7 exchange A[i + 1] with A[r]
8 return i + 1

PARTITION 总是选择一个 x = A [ r ]作为主元（pivot element），并围绕它来划分子数组。在第3行到第6行中循环的每一轮迭代开始时，对于任何数组下标 k ，有

如果 p <= k <= i ，则 A [ k ] <= x
如果 i + 1 <= k <= j - 1，则 A [ k ] > x
如果 k = r ，则 A [ k ] = x

下图总结了这一结构。过程 PARTITION 作用于子数组 A [ p .. r ]后得到四个区域。 A [ p .. i ]中的各个值都小于等于 x ， A [ i + 1 .. j - 1 ]中的值都大于 x ， A [ r ] = x 。 A [ j .. r - 1 ]中的值可以是任何值。

快速排序的简单Java实现

private static int partition(int[] array, int p, int r) {
    int x = array[r];
    int i = p - 1;
    for (int j = p; j < r; j++)
        if (array[j] < x) {
            i++;
            AlgorithmUtil.swap(array, i, j);
        }
    AlgorithmUtil.swap(array, i + 1, r);
    return i + 1;
}

/**
 * 快速排序
 */
public static void quickSort(int[] array) {
    quickSort(array, 0, array.length - 1);
}

private static void quickSort(int[] array, int p, int r) {
    if (p < r) {
        int q = partition(array, p, r);
        quickSort(array, p, q - 1);
        quickSort(array, q + 1, r);
    }
}

快速排序的性能

快速排序的运行时间与划分是否对称有关，而后者又与选择了哪一个元素来进行划分有关。如果划分是对称的，那么本算法从渐近意义上来讲，就和归并排序算法一样快；如果划分是不对称的，那么本算法渐近上就和插入排序一样慢。

最坏情况划分

快速排序的最坏情况划分发生在划分过程产生的两个区域分别包含 n - 1个元素和1个0元素的时候。假设算法的每一次递归调用都出现了这种不对称划分。划分的时间代价为 Θ ( n )。对一个大小为0的数组进行递归调用后，返回 T ( 0 ) = Θ ( 1 )，故算法的运行时间为 T ( n ) = T ( n - 1 ) + Θ ( n )。最终得到解为 T ( n ) = Θ ( n² )。

最佳情况划分

在 PARTITION 过程可能的最平衡划分中，一个子问题的大小为 FLOOR（n / 2） ，另一个子问题的大小为 CEIL(n / 2) - 1。这种情况下，其运行时间的递归式为 T ( n ) <= 2 T ( n / 2 ) + Θ ( n )。该递归式的解为 T ( n ) = O ( n lg n )。

快速排序的随机化版本

随机划分使用 随机取样 （random sampling）的随机化技术，从子数组 A [ p .. r ]中随机选择一个元素并与 A [ r ]互换，因为主元是随机选择的，我们期望在平均情况下，对输入数组的划分能够比较对称。

RANDOMIZED-PARTITION(A, p, r)
1 i = RANDOM(p, r)
2 exchange A[r] with A[i]
3 return PARTITION(A, p, r)

比较排序

之前已经介绍了几种能在 O ( n lg n )时间内排序 n 个数的算法。比如归并排序，堆排序和快速排序。这些算法都有一个相同的性质：排序结果中，各元素的次序基于输入元素间的比较。这类排序算法统称为 比较排序 。

在一个比较排序算法中，仅用比较来确定输入序列< a₁ ， a₂ ， …， a_n >的元素间次序。就是说，给定两个元素 a_i 和 a_j ，测试 a_i < a_j ， a_i <= a_j ， a_i = a_j ， a_i >= a_j 或 a_i > a_j 中的哪一个成立，以确定 a_i 和 a_j 之间的相对次序。

比较排序可以被抽象地视为 决策树 。一棵决策树是一棵满二叉树，表示某排序算法作用于给定输入所做的所有比较，而控制结构，数据移动等都被忽略了。下图是插入排序作用于含三个元素的输入序列上的决策树。

在决策树中，对每个内结点都注明 i ： j ，其中1 <= i ， j <= n ， n 是输入序列中的元素个数。对每个叶结点都注明排列< π ( 1 )， π ( 2 )， …， π （ n ）>。排序算法的执行对应于遍历一条从树根到叶结点的路径。在每个内结点处都要做比较。当到达一个叶结点是，排序算法就确定了顺序。要使排序算法能正确地工作，其必要条件是， n 个元素的 n! 中排列中的每一种都要作为决策树的一个叶子出现。

posted on 2014-04-12 18:53 sungoshawk 阅读(2234) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

算法导论读书笔记（7）

算法导论读书笔记（7）

目录

快速排序

快速排序的简单Java实现

快速排序的性能

最坏情况划分

最佳情况划分

快速排序的随机化版本

比较排序

公告