【数据结构】树和二叉树2
树和二叉树
主要内容
1.树的逻辑结构 2.树的存储结构
3.二叉树的逻辑结构 4.二叉树德尔存储结构及实现
5.树、森林与二叉树的转换 6.哈夫曼树
6.1 树的逻辑结构
树的定义
- 树的定义是采用递归方法
- 树、空树、根的结点、子树
树的表示
树状图、嵌套集合、广义表表示、凹入表示
树的基本术语
- 结点的度:结点所拥有的子树的个数。
- 树的度:树中各结点度的最大值。
- 叶子结点:度为0的结点,也称为终端结点。
- 分支结点:度不为*0的结点,也称为非终端结点。
- 孩子、双亲:树中某结点子树的根结点称为这个结点的孩子结点,这个结点称为它孩子结点的双亲结点;
- 兄弟:具有同一个双亲的孩子结点互称为兄弟。
- 路径、路径长度
- 祖先、子孙
- 结点所在层数:根结点的层数为1;对其余任何结点,若某结点在第k层,则其孩子结点在第k+1层。
- 树的深度:树中所有结点的最大层数,也称高度。
- 层序编号
- 有序树、无序树(数据结构中讨论的一般都是有序树)
- 森林:m (m≥0)棵互不相交的树的集合。
- 同构:对两棵树,若通过对结点适当地重命名,就可以使这两棵树完全相等(结点对应相等,结点对应关系也相等),则称这两棵树同构。
树的遍历操作
-
树的遍历:从根结点出发,按照某种次序访问树中所有结点,使得每个结点被访问一次且仅被访问一次。
-
访问:抽象操作,可以是对结点进行的各种处理,这里简化为输出结点的数据。
-
遍历的实质:树结构(非线性结构)→线性结构。
-
遍历方式:树通常有前序(根)遍历、后序(根)遍历和层序(次)遍历三种方式。
6.2 二叉树
二叉树
- 研究意义:将树转换为二叉树,从而利用二叉树解决树的有关问题。
- 二叉树的定义(空二叉树、左子树、右子树)
- 二叉树的特点(1)每个结点最多有两棵子树。(2)二叉树是有序的,其次序不能任意颠倒。
注意:二叉树和树是两种树结构。
特殊的二叉树
斜树
- 左斜树和右斜树统称为斜树。
- 斜树的特点:
- 在斜树中,每一层只有一个结点。
- 斜树的结点个数与其深度相同。
满二叉树
1.满二叉树:所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上。
2.满二叉树的特点:
1. 叶子只能出现在最下一层。
2. 只有度为0或度为2的结点。
3.两个最多:
1. 满二叉树在同样深度的二叉树中结点个数最多。
2. 满二叉树在同样深度的二叉树中叶子结点个数最多。
完全二叉树
- 完全二叉树:对一棵具有n个结点的二叉树按层序编号,如果编号为i(1≤i≤n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中的位置完全相同。
- 在满二叉树中,从最后一个结点开始,连续去掉任意个结点,即是一棵完全二叉树。
- 完全二叉树的特点:
- 叶子结点只能出现在最下两层,且最下层的叶子结点都集中在二叉树的左部;
- 完全二叉树中如果有度为1的结点,只可能有一个,且该结点只有左孩子。
- 深度为k的完全二叉树在k-1层上一定是满二叉树。
二叉树的基本性质
- 二叉树的第i层上最多有2^(i-1)个结点(i≥1)。
- 一棵深度为k的二叉树中,最多有2^k - 1个结点,最少有k个结点。
- 在一棵二叉树中,如果叶子结点数为n0,度为2的结点数为n2,则有: n0=n2+1。
- 具有n个结点的完全二叉树的深度为 [log2n ] +1
- 对一棵具有n个结点的完全二叉树中从1开始按层序编号,则对于任意的序号为i(1≤i≤n)的结点(简称为结点i),有:
- 如果i>1,则结点i的双亲结点的序号为 i/2;如果i=1,则结点i是根结点,无双亲结点。
- 如果2i≤n,则结点i的左孩子的序号为2i;如果2i>n,则结点i无左孩子。
- 如果2i+1≤n,则结点i的右孩子的序号为2i+1;如果2i+1>n,则结点 i无右孩子。
二叉树的顺序存储结构
1.二叉树的顺序存储结构就是用一维数组存储二叉树中的结点,并且结点的存储位置(下标)应能体现结点之间的逻辑关系——父子关系。
2.完全二叉树和满二叉树中结点的序号可以唯一地反映出结点之间的逻辑关系 。
3.二叉树的顺序存储结构一般仅存储完全二叉树
二叉树的链式存储表示
种类
1.二叉链表 2.三叉链表 3.双亲链表 4.线索链表
二叉链表
- 基本思想:令二叉树的每个结点对应一个链表结点,链表结点除了存放与二叉树结点有关的数据信息外,还要设置指示左右孩子的指针。
- 结点结构:
lchild | data | rchild - 具有n个结点的二叉链表中,有n+1个空指针。
三叉链表
- 引入了头指针root
- 结点结构:
parent | lchild | data | rchild
双亲链表
- 结点结构:
data | parent | LRTag
6.4 线索二叉树和遍历二叉树
一.遍历二叉树
-
遍历次序:前序遍历、中序遍历、后序遍历、层序遍历
-
两个推论:
- 若已知一棵二叉树的前序序列和中序序列,则可以唯一的确定这棵二叉树.
- 若已知一棵二叉树的后序序列和中序序列,则也可以唯一的确定这棵二叉树.
-
遍历算法的递归实现:
void Preorder (BiTree T, void( *visit)(TElemType& e)) { // 先序遍历二叉树 if (T) { visit(T->data); // 访问结点 Preorder(T->lchild, visit); // 遍历左子树 Preorder(T->rchild, visit);// 遍历右子树 } } -
遍历算法的应用举例:
- 统计二叉树中叶子结点的个数(先序遍历)
- 求二叉树的深度(后序遍历)
- 建立二叉树的存储结构
- 删除并释放二叉树中以元素值为x的结点作为根的各子树
- 求位于二叉树先序序列中第k个位置的结点的值
二.线索二叉树
- 定义:
1.线索:将二叉链表中的空指针域指向前驱结点和后继结点的指针被称为线索
2.线索化:使二叉链表中结点的空链域存放其前驱或后继信息的过程称为线索化
3.线索二叉树:加上线索的二叉树称为线索二叉树。 - 结点结构:
LTag | lchild | data | rchild |RTag
LTag为0时,lchild指向该结点的左孩子;为1时,lchild指向该结点的前驱结点
RTag为0时,lchild指向该结点的右孩子;为1时,lchild指向该结点的后继结点
树、森林与二叉树的转换
树转换成二叉树
⑴加线——树中所有相邻兄弟之间加一条连线。 ⑵去线——对树中的每个结点,只保留它与第一个孩子结点之间的连线,删去它与其它孩子结点之间的连线。 ⑶层次调整——以根结点为轴心,将树顺时针转动一定的角度,使之层次分明。
树的前序遍历等价于二叉树的前序遍历!
树的后序遍历等价于二叉树的中序遍历!
森林转换为二叉树
⑴ 将森林中的每棵树转换成二叉树;
⑵ 从第二棵二叉树开始,依次把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子,当所有二叉树连起来后,此时所得到的二叉树就是由森林转换得到的二叉树。
二叉树转换为树或森林
``⑴ 加线——若某结点x是其双亲y的左孩子,则把结点x的右孩子、右孩子的右孩子、……,都与结点y用线连起来; ⑵ 去线——删去原二叉树中所有的双亲结点与右孩子结点的连线;
⑶ 层次调整——整理由⑴、⑵两步所得到的树或森林,使之层次分明。`
森林有两种遍历方法:
⑴前序(根)遍历:前序遍历森林即为前序遍历森林中的每一棵树。
⑵后序(根)遍历:后序遍历森林即为后序遍历森林中的每一棵树。
6.6 哈夫曼树及哈夫曼编码
相关概念
- 叶子结点的权值:对叶子结点赋予的一个有意义的数值量。
- 二叉树的带权路径长度:设二叉树具有n个带权值的叶子结点,从根结点到各个叶子结点的路径长度与相应叶子结点权值的乘积之和。 记为:

- 哈夫曼树:给定一组具有确定权值的叶子结点,带权路径长度最小的二叉树。
哈夫曼树的特点:
- 权值越大的叶子结点越靠近根结点,而权值越小的叶子结点越远离根结点。
- 只有度为0(叶子结点)和度为2(分支结点)的结点,不存在度为1的结点.
哈夫曼算法基本思想:
⑴ 初始化:由给定的n个权值{w1,w2,…,wn}构造n棵只有一个根结点的二叉树,从而得到一个二叉树集合F={T1,T2,…,Tn};
⑵ 选取与合并:在F中选取根结点的权值最小的两棵二叉树分别作为左、右子树构造一棵新的二叉树,这棵新二叉树的根结点的权值为其左、右子树根结点的权值之和;
⑶ 删除与加入:在F中删除作为左、右子树的两棵二叉树,并将新建立的二叉树加入到F中;
⑷ 重复⑵、⑶两步,当集合F中只剩下一棵二叉树时,这棵二叉树便是哈夫曼树。
哈夫曼树的存储结构
weight | lchild | rchild | parent
哈夫曼树应用——哈夫曼编码
编码:给每一个对象标记一个二进制位串来表示一组对象。 例:ASCII,指令系统
等长编码:表示一组对象的二进制位串的长度相等。
不等长编码:表示一组对象的二进制位串的长度不相等。
前缀编码:一组编码中任一编码都不是其它任何一个编码的前缀 。 (前缀编码保证了在解码时不会有多种可能。)
例题:
一组字符{A, B, C, D, E, F, G}出现的频率分别是{9, 11, 5, 7, 8, 2, 3},设计最经济的编码方案。

小结


浙公网安备 33010602011771号