聊聊算法--堆的构建和调整

先提个问题,完全二叉树/满二叉树,区别?前者是指每一层都是紧凑靠左排列,最后一层可能未排满,后者是一种特殊的完全二叉树,

每层都是满的,即节点总数和深度满足N=(2^n) -1。堆Heap,一堆苹果,为了卖相好,越好看的越往上放,就是大顶堆;为了苹果堆

的稳定,质量越小越往上放,就是小顶堆;堆首先是完全二叉树,但只确保父节点和子节点大小逻辑,不关心左右子节点的大小关系,

通常是一个可以被看做一棵树的数组对象,是个很常见的结构,比如BST对象,都与堆有关系,今天就说下这个重要的数据结构和应用。

 

作者原创文章,谢绝一切转载,违者必究!

本文只发表在"公众号"和"博客园",其他均属复制粘贴!如果觉得排版不清晰,请查看公众号文章。 

 

准备:

Idea2019.03/Gradle6.0.1/Maven3.6.3/JDK11.0.4

难度: 新手--战士--老兵--大师

目标:

1.堆的构建和调整算法

1 优先级队列

为理解堆的原理,先看优先级队列,它是一种数据结构,插入或者删除元素的时候,元素会自动排序,(优先级不是狭义的数值大小,

但为了通俗理解,这里以字母序为例),通常使用数组存储,我们可以按照下图进行转换,序号 0 不用:

优先级队列的实现(Java版):

public class PriorityQueue<Key extends Character> {
    /** 存储元素的数组 */
    private Key[] keys;
    private int N = 0;

    public PriorityQueue(int capacity){
        // 下标0不用,多分配一个单位
        keys = (Key[]) new Character[capacity + 1];
    }

    public Key max(){
        return keys[1];
    }

    public void insert(Key e){
        N ++;
        keys[N] = e;
        swim(N);
    }
    public Key delMax(){
        Key max = keys[1];
        swap(1,N);
        keys[N] = null;
        N --;
        // 让第一个元素下沉到合适的位置
        sink(1);
        return max;
    }
    /** 上浮第k个元素*/
    private void swim(int k){
        // 比父节点小,即进行交换,直到根
        while (k > 1 && less(parent(k),k)){
            swap(k,parent(k));
            k = parent(k);
        }
    }
    /** 下沉第 k 个元素*/
    private void sink(int k){
        while(k < N){
            int small = left(k);
            if (right(k) < N && less(right(k),left(k))){
                small = right(k);
            }
            if (less(k,small)){
                swap(k,small);
                k = small;
            }
        }
    }
    private void swap(int i,int j){
        Key temp = keys[i];
        keys[i] = keys[j];
        keys[j] = temp;
    }
    /** 元素i和j大小比较*/
    private boolean less(int i,int j){
//   'a' - 'b' = -1 ;
        return keys[i].compareTo(keys[j]) > 0;
    }
    /** 元素i的父节点*/
    private int parent(int i){
        return i/2;
    }
    /** 元素i的左子节点*/
    private int left(int i){
        return i * 2;
    }
    /** 元素i的右子节点*/
    private int right(int i){
        return i * 2 + 1;
    }
}
 

以上代码解析:

1 swim 上浮,对于元素k,是否需要上浮,仅需与其父节点比较,大于父节点则交换,迭代直到根节点;

2 sink 下沉,对于元素k,是否需要下沉,需先比较其左右子节点,找出左右子节点中较小者,较小者若比父节点大,则交换,迭代直到末尾元素;

3 insert 插入,先将元素放到数组末尾位置,再对其进行上浮操作,直到合适位置;

4 delMax 删除最大值,大根堆,故第一个元素最大,先将首末元素交换,再删除末尾元素,再对首元素下沉操作,直到合适位置;

总结:以上只是Java简化版,java.util.PriorityQueue 是JDK原版,客官可自行研究。但设计还是非常有技巧的,值得思考一番,假设 insert 插入

到首位,会导致数组大量元素移动。delMax 若直接删除首位最大值,则需要进一步判断左右子节点大小,并进行先子节点上浮再首元素下沉操作。

        有了这个堆结构,就可以进行堆排序了,将待排数全部加入此堆结构,然后依次取出,即成有序序列了!

2 堆排序

如要求不使用上述堆数据结构。思路(升序为例):将数组构建为一个大顶堆,首元素即为数组最大值,首尾元素交换;排除末尾元素后调整大顶堆,

则新的首元素即为次最大值,交换首尾并再排除末尾元素;如此循环,最后的数组即为升序排列

public class HeapSort02 {
    public static void main(String []args){
        int []arr = {2,1,8,6,4,7,3,0,9,5};
        sort(arr);
        System.out.println(Arrays.toString(arr));
    }

    public static void sort(int []arr){
        int len = arr.length;
        // 创建一个大顶堆
        for(int i = (int) Math.ceil(len/2 - 1); i >= 0; i--){
            //从第一个非叶子结点从下至上,从右至左调整结构
            adjustHeap(arr,i,len);
        }
        // 交换首尾元素,并重新调整大顶堆
        for(int j = len-1;j > 0;j--){
            swap(arr,0,j);
            adjustHeap(arr,0,j);
        }
    }

    /** 迭代写法*/
    public static void adjustHeap(int []arr,int i,int length){
        int temp = arr[i];
        for (int k = 2*i + 1; k < length; k=k*2 + 1) {
        // 注意这里的k + 1 < length
            // 如果右子节点大于左子节点,则比较对象为右子节点
            if (k + 1 < length && arr[k] < arr[k+1]){
                k++;
            }
            if (arr[k] > temp){
                // 不进行值交换
                arr[i] = arr[k];
                i = k;
            }
            else{
                break;
            }
        }
        arr[i] = temp;
    }

    /** 递归写法*/
    private static void adjustHeap2(int[] arr, int i, int len){
        int left = 2 * i + 1;
        int right = 2 * i + 2;
        int maxIndex = i;
        // 注意这里的 left < len
        if (left < len && arr[left] > arr[maxIndex]){
            maxIndex = left;
        }
        if (right < len && arr[right] > arr[maxIndex]){
            maxIndex = right;
        }
        if (maxIndex != i){
            swap(arr,i,maxIndex);
            adjustHeap2(arr,maxIndex,len);
        }
    }

    /** 交换元素 */
    public static void swap(int []arr,int a ,int b){
        int temp=arr[a];
        arr[a] = arr[b];
        arr[b] = temp;
    }
}
 

以上代码解析:

1完全二叉树结构中,如果根节点顺序号为 0,总节点数为 N,则最末节点的父节点即为最后一个非叶子节点,顺序号为 ceil(N/2 -1),

2 adjustHeap2 为啥使用三个参数,不用中间的参数可以?使用三个参数,是为了进行递归调用,因为递归肯定是缩小计算规模,而这里的形参arr和len是固定不变的;

3 adjustHeap是非递归写法,不用中间的参数可以?调用一在“构建大顶堆”处,可写为函数体内初始化 i,并形成双重 for 循环;调用二在“重新调整大顶堆”处,

    可见中间参数为 0,可直接去掉。故回答是可以!但需要调整写法,且影响该方法复用,这里直接写为三个形参的函数更为优雅而已。

4非递归写法理解:类似插入排序思想(依次移动并找到合适的位置再插入),先将 arr[i] 取出,然后此节点和左右子树进行比较,如子树更大则子节点上升一层,使

    用for循环迭代到最终位置,并进行赋值;

 

以 i=0 为例:

5递归方式理解:定位目标元素的左右子树,若子树值更大,则进行值交换,且因为子树发生了变化,故需要对子树进行递归处理;

3 前K个最大的数

在N个数中找出前K个最大的数: 思路:从N个数中取出前K个数,形成一个数组[K],将该数组调整为一个小顶堆,则可知堆顶为K个数中最小值,

然后依次将剩余 N-K 个数与堆顶比较,若大于,则替换掉并调整堆,直到所有元素加入完毕,堆中元素即为目标集合。

public class HeapSort {
    public static void main(String[] args) {
        int[] arr = new int[100];
        for (int i = 0; i < 100; i++) {
            arr[i] = i + 1;
        }
        // 前10个最大的数
        int k = 10;
        // 构造小顶堆
        for (int i = (int) Math.ceil(k/2 - 1); i >= 0; i--) {
            adjustHeap(arr,i,k);
        }
        // 依次比较剩余元素
        for (int i = 10; i < arr.length; i++) {
            if (arr[i] > arr[0]){
                swap(arr,0,i);
                adjustHeap(arr,0,k);
            }
        }
        // 输出结果
        for (int i = 0; i < 10; i++) {
            System.out.print(arr[i]+"-");
        }
    }

    /** 非迭代写法 ,对arr[i]进行调整 */
    private static void adjustHeap(int[] arr,int i,int length){
        int temp = arr[i];
        for (int k = i * 2 + 1; k < length; k = k * 2 + 1) {
            // 因第一次循环中可能越界,故需要 k+1 < length
            if (k + 1 < length && arr[k] > arr[k + 1]){
                k++;
            }
            if (arr[k] < temp){
                arr[i] = arr[k];
                i = k;
            }
            else {
                break;
            }
        }
        arr[i] = temp;
    }
    /** 递归写法 */
    private static void adjustHeap2(int[] arr,int i,int length){
        int left = i * 2 + 1;
        int right = i * 2 + 2;
        int samller = i;
        if (left < length && arr[left] > arr[samller]){
            samller = right;
        }
        if (right < length && arr[right] > arr[samller]){
            samller = right;
        }
        if (samller != i){
            swap(arr,i,samller);
            adjustHeap2(arr,samller,length);
        }
    }

    /** 交换元素 */
    public static void swap(int []arr,int a ,int b){
        int temp=arr[a];
        arr[a] = arr[b];
        arr[b] = temp;
    }
}
 

以上代码解析:按照"初始化—构建小顶堆—比较调整—输出结果"执行。注意for循环中,因第一次循环中未使用for语句条件判断,可能越界,故需要 k+1 < length

输出结果如下:

请看官思考,如果需求变为找出N个数中找出前K个最小的数,该如何实现? 建议动脑且动手的写一遍!因为魔鬼在细节!

全文完!


我近期其他文章:

    只写原创,敬请关注 

posted @ 2020-06-28 09:22  甲由崽  阅读(1526)  评论(0编辑  收藏  举报