代码改变世界

《编程珠玑,字字珠玑》读书笔记完结篇——AVL树

2012-04-26 14:34 捣乱小子 阅读(...) 评论(...) 编辑 收藏

写在最前面的

手贱翻开了《珠玑》的最后几章,所以这一篇更多是关于13、14、15章的内容。这篇文章的主要内容是“AVL树”,即平衡树,比红黑树低一个等次。捣乱真惹不起红黑树,情况很复杂;而AVL思路比较清晰。《编程珠玑,字字珠玑》910读书笔记——代码优化更新了,做了点关于“哨兵”的笔记。在这篇文章的末尾,笔者还加了对引用调用的“大彻大悟”。

4篇读书笔记:全在这里

AVL树

学习数据结构的时候,有过一次实验课, 题意大概:英文单词出现次数统计。当时选了哈希表,映射(map),AVL树(平衡树)三种方法来做,是冲着“完成实验老师请吃饭”去做的。哈希表键值用“除留余数法”,处理冲突用了最简单的开哈希表的“链地址法”。 映射(map)没有深入,只是简单的应用。 比较痛心的是AVL树。

AVL树的旋转

树的旋转分四种:左单旋,右单旋,左右旋转,右左旋转。规定,右子树的高度减去左子树的高度得到此节点的平衡数(也叫平衡因子,balance factor,bf),用bf(node)表示node节点的平衡数。小剖一下这四种情况:

当bf(node)==2的时候,即右子树高度比左子树高,需要将树在node节点左单旋。在作旋转之后,左子树bf+1,右子树bf-1,node节点平衡数归零。
image
节点的调整过程很清晰。

 

再来当bf(node)==-2时候,即右子树比左子树低。需要将树在node节点右单旋。在作选择之后,左子树bf-1,右子树+1,node节点平衡树归零。
image 
细心的发现,左单旋和右单旋是一样的,只是反过来罢了。

 

下面的情况复杂了点,但是他们是从上面两种情况延伸过来的,但是这种变化导致它们平衡化的方法也有小小不同。 下面两种情况从子树的内侧插入,导致子树(bf(kid))和其父亲(bf(parent))的bf正负相反,先来左右旋转,看图:

image
解决之道:kid节点作简单的左单旋,然后parent作简单的右单旋。在过程中需要非常注意节点bf的调整,要分情况进行讨论(把这个槛跨过去,离成功就不远了)。

  • 如果从左kid的右子树(grandkid)的左侧插入,
    对bf(kid)调整:那么bf(grandkid)<0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=0;
    对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)<0,那么bf(parent)=1; 

  • 如果从左kid的右子树(grandkid)的右侧插入,
    对bf(kid)调整:那么bf(grandkid)>0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=-1;
    对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)<0,那么bf(parent)=0;
  • 对bf(grandkid)调整:最后,grandkid被调整为新树的根节点,bf(grandkid)=0。

(作一个填空题吧) 结合下面的图来做,属于右左旋转:

 
如果从右kid的左子树(grandkid)的左侧插入,
对bf(kid)调整:那么bf(grandkid)    0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=   
对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)    0,那么bf(parent)=   
 
如果从右kid的左子树(grandkid)的右侧插入,
对bf(kid)调整:那么bf(grandkid)    0,在kid作了左单旋之后,grandkid的左侧树被调整为kid的右子树,结果bf(kid)=   
对bf(parent)调整:在对parent作了右单旋之后,grandkid右子树被调整为parent的左子树,因此如果bf(grandkid)    0,那么bf(parent)=   

对bf(grandkid)调整:最后,grandkid被调整为新树的根节点,bf(grandkid)=   

答案:<,1,<,0;>,0,>,-1。

 

可以看出三个节点在调整过程中需要更改bf。最后一种旋转就是右左旋转。不需要太多的分析,跟上面的是一样的,做一个简单的反转。捣乱上图:

image

构造一个平衡树,即不断将一个新的节点在原树中找到合适的位置,然后调整。那么在“找”的过程中,所经历的节点bf都改变了(+1或者-1)。插入一个节点的做法是: 用栈存储所走过的节点,在找到插入位置后,从插入位置的父节点开始调整,如果此父节点是平衡的,那么从栈中取出父节点,继续调整。

从上面的分析中,只要旋转后,结果旋转的节点都会得到bf(node)=0结果,所以只要旋转后,我们的目的就达到了——树平衡了!所以bf(node)==0d的节点会越来越多,而且是堆积在树的顶层。

image

因此,不需要每次都调整到树的根节点root,只要调整的节点bf=0,就可以结束了,上面的节点或者兄弟节点已经bf=0。这我在刚接触AVL的时候也很迷惑的地方。

最后我把insert节点的代码给出:

/***********************************
 ** sample
 **********************************/
void avl::insert(int data) 
{ 
    node * parent = 0,* p = root,* t = new node(data); 
    stack<node *> s; 
    while (p) 
    { 
        int ret = p->comp(*t); 
        if(ret==0)    {delete t;    return;}     
        parent = p;s.push(parent); 
        if(ret<0)     
            p = p->right; 
        else    p = p->left; 
    }// while 

    p = t; 
    assert(p); 

    if (!root) 
    { 
        root = p; 
        return; 
    }// if 

    if(parent->comp(*t)>0)     
        parent->left = p; 
    else    parent->right = p; 

    while (!s.empty()) 
    { 
        parent = s.top(); 
        s.pop(); 

        if(p==parent->left)    parent->bf--; 
        else    parent->bf++; 

        int d; 
        if(parent->bf==0)    break; 
        if(abs(parent->bf)==1)    p=parent; 
        else 
        { 
            d =  parent->bf<0?-1:1; 
            if(d<0 && p->bf<0)    r(parent); 
            else if(d>0 && p->bf>0)    l(parent); 
            else if(d>0 && p->bf<0)    rl(parent); 
            else lr(parent); 
            break; 
        }// if 
    }// while 

    if (s.empty()) 
        root = parent; 
    else 
    { 
        p = s.top(); 
        if(p->comp(*parent)>0) 
            p->left = parent; 
        else 
            p->right = parent; 
    }// if 
}

另外,旋转的代码我放在附件里面(如果都贴出来显得很臃肿),再者,附件里有一个“单词统计”的实验报告,有兴趣的同学可以下载看看。当时做实验的时候,AVL统计单词还是挺给力的:

image

 

漫谈引用调用

注意:ANSI C里不支持引用调用,而C++提供了引用调用的实现。
正如《effective c++》条款1提及的,指针和引用有应用上的区别。指针所指的对象可以随意更改,而且它的指向可以为null,非常灵活;但引用必须代表一个对象,不能为null,而且它被赋予某个对象后,它将始终代表那个对象知道被销毁为止。例如:
 

/***********************************
 ** sample
 **********************************/
 int b = 1;   
 int &a = b; 

a成为了b的引用,a将不能再引用其他数据。另外,引用变量是否占有内存听说唯有定义http://topic.csdn.net/u/20100622/15/728477fe-92ab-4e83-8572-0923d37186f1.html),笔者认为可行的方法是程序只在在变量的符号表中添加a,而并没有为a分配任何的内存。

在函数传参的过程中,有值传递,指针传递(都属于c)和引用传递方式(c++)。指针所能做到的,引用也可以做得到。但引用更安全(不至于让它为null),操作起来更方便,同时拥有和指针优点——“节能减排”。来看看:

/***********************************
 ** sample
 **********************************/
function(TYPE * a)  
    a = new TYPE  
    ****  
main()  
    TYPE * a = NULL;  
    function(a);     
    *** 

在function返回后,a依旧为原来的NULL,并没有改变。因为你想,function函数栈内,只保存了指针a的原值NULL,即使a = new TYPE能为a赋予新址,但此a非彼a,在function退栈后,此a将被销毁,而彼a仍旧为NULL。因此如果想更改a指针的内容,必须使用指针的指针或者指针的引用,指针的引用会比较方便。

/***********************************
 ** sample
 **********************************/
function(TYPE *& a)  
    a = new TYPE  
    ****  
main()  
    TYPE * a = NULL;  
    function(a);     
    *** 

这时,指针a的值才有所改变。AVL树的程序里有较多的引用调用,读者要注意。捣乱纳闷,这笔记,这大彻大悟,应早在大一就应该写下,羞愧于心,贻笑大方呐。

关于珠玑的总结

珠玑我到底还是把它当作休闲读物了,对于算法或者数据结构的初学者,这一本是力荐的。

 

附件:

本文完 Thursday, April 26, 2012

捣乱小子 http://daoluanxiaozi.cnblogs.com/