1.02k likes | 1.14k Views
第 8 章 树和二叉树. 树 二叉树 二叉树设计 二叉树遍历 线索二叉树 哈夫曼树 等价问题 树与二叉树的转换 树的遍历. 主要知识点. 8.1 树. 1. 树的定义. 树是由 n ( n ≥0 ) 个结点组成的有限集合 T 。 n=0 的树称为空树;对 n >0 的树,有 :( 1) 仅有 一个特殊的结点称为根结点 ,根结点没有前驱结点; (2) 当 n >1 时,除根结点外其余的结点分为 m ( m >0) 个 互不相交 的有限集合 T 1 , T 2 , … , T m ,其中每个集合 T i 本身又是一棵结构和树类似的子树。.
E N D
第8章 树和二叉树 树 二叉树 二叉树设计 二叉树遍历 线索二叉树 哈夫曼树 等价问题 树与二叉树的转换 树的遍历 主要知识点
8.1 树 1.树的定义 树是由n(n≥0)个结点组成的有限集合T。n=0的树称为空树;对n>0的树,有:(1)仅有一个特殊的结点称为根结点,根结点没有前驱结点;(2)当n>1时,除根结点外其余的结点分为m(m>0)个互不相交的有限集合T1,T2,…,Tm,其中每个集合Ti本身又是一棵结构和树类似的子树。 注:树的定义具有递归性,即“树中还有树”。
A B C L K F F G D E H I J 若干术语 结点:由数据元素和构造数据元素之 间关系的指针组成 结点的度:结点所拥有的子树的个数 叶结点:度为0的结点,也称作 终端结点 分支结点:度不为0的结点
孩子结点:树中一个结点的子树的根结点 双亲结点:若树中某结点有孩子结点,则这个结点就 称作它的孩子结点的双亲结点 兄弟结点:具有相同的双亲结点的结点 树的度:树中所有结点的度的最大值 结点的层次:从根结点到树中某结点所经路径上的分支数 树的深度:树中所有结点的层次的最大值
无序树:树中任意一个结点的各孩子结点之间的次序无序树:树中任意一个结点的各孩子结点之间的次序 构成无关紧要的树 有序树:树中任意一个结点的各孩子结点有严格排列 次序的树 森林:m(m≥0)棵树的集合 2.树的表示方法 (1)直观表示法 (2)形式化表示法 (3)凹入表示法
T=(D,R) • DF = D1∪D2∪…∪Dm(1≤i,j≤m, Di∩Dj=¢) • R={<Root, ri>, i=1,2,…,n-1} A B E J F C G K L D H I
3.树的抽象数据类型 数据集合:树的结点集合,每个结点由数据元素和构造数 据元素之间关系的指针组成。 操作集合: (1)创建MakeTree(T) (2)撤消DestroyTree(T) (3)双亲结点Parent(T, curr) (4)左孩子结点LeftChild(T, curr) (5)右兄弟结点RightSibling(T, curr) (6)遍历树Traverse(T, Visit())
4.树的存储结构 树的结点之间的逻辑关系主要有双亲-孩子关系,兄弟关系。因此,从结点之间的逻辑关系分,树的存储结构主要有:双亲表示法、孩子表示法、双亲孩子表示法和孩子兄弟表示法四种组合。 指针有常规指针和仿真指针
data parent A -1 0 1 2 3 4 5 6 7 8 B 0 C 0 A D 1 E 1 B F 1 G 2 H 4 G I F H C E D 4 I (1)双亲表示法 (a)一棵树 (b)仿真指针的双亲表示法存储结构 树及其使用仿真指针的双亲表示法
root A ∧ B C ∧ ∧ G E F D ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧ H I ∧ ∧ ∧ ∧ ∧ ∧ 常规指针的孩子表示法 (2)孩子表示法
child next data parent head A -1 0 1 2 3 4 5 6 7 8 1 ∧ 2 B 0 ∧ 5 4 3 C 0 6 ∧ D 1 ∧ E 1 7 8 ∧ F 1 ∧ G 2 ∧ H 4 ∧ 4 I ∧ (3)双亲孩子表示法 双亲孩子表示法存储结构
root A ∧ C B ∧ ∧ D ∧ F ∧ ∧ ∧ E G H I ∧ ∧ ∧ (4)孩子兄弟表示法 常规指针的孩子兄弟表示法
1.二叉树的定义 8.2 二叉树 一、二叉树:是n(n≥0)个结点的有限集合。n=0的树称为空二叉树;n>0的二叉树由一个根结点以及两棵互不相交的、分别称为左子树和右子树的二叉树组成 。 逻辑结构: 一对二(1:2) 基本特征: ① 每个结点最多只有两棵子树(不存在度大于2的结点); ② 左子树和右子树次序不能颠倒。所以下面是两棵不同的树
A A C C B B D D E E F F G G 二、满二叉树:在一棵二叉树中,如果所有分支结点都存在左 子树和右子树,并且所有叶子结点都在同一层上,这样的 二叉树称为满二叉树。 三、完全二叉树:如果一棵深度为k,有n个结点的二叉树中各 结点能够与深度为k的顺序编号的满二叉树从1到n标号的 结点相对应的二叉树称为完全二叉树。如下图所示
A A B C B C E F G D E F G D H I J K L M N O H I J (b)完全二叉树 (a)满二叉树 问题:一个高度为h的完全二叉树最多有多少个结点?最少有多少个结点?
2.二叉树抽象数据类型 数据集合:二叉树的结点集合,每个结点由数据元素和构造数据元素之间关系的指针组成。 操作集合: (1)创建MakeTree(T) (2)撤消DestroyTree(T) (3)左插入结点InsertLeftNode(curr, x) (4)右插入结点InsertRightNode(curr, x) (5)左删除子树DeleteLeftTree(curr) (6)右删除子树DeleteRightTree(curr) (7)遍历二叉树Traverse(T, Visit())
3.二叉树的性质 性质1 在一棵非空二叉树的第i层上至多有2i个结点(i≥0)。 性质2 深度为k的二叉树至多有2k+1-1个结点。 说明:深度k=-1,表示没有一个结点;深度k=0,表示只有一个根结点。
性质3对于一棵非空的二叉树,如果叶结点个数为n0,度为2的结点数为n2,则有 n0= n2+1。 证明:设n为二叉树的结点总数,n1为二叉树中度为1的结点个数,则有: n = n0 + n1 + n2 另外,在二叉树中,除根结点外的所有结点都有一个惟一的进入分支,设M为二叉树中所有结点的进入分支数,则有: M = n - 1 从二叉树的结构可知,二叉树的所有进入分支是由度为1的结点和度为2的结点发出的,每个度为1的结点发出一个分支,每个度为2的结点发出两个分支,所以又有: M = n1 + 2 × n2 因此有: n - 1 = n1 + 2 × n2 再把 n=n0+n1+n2 代入,则可以得到 n0 = n2 + 1。
性质4 具有n个结点的完全二叉树的深度k为大于或等于lb(n+1)-1的最小整数。 证明:由性质2和完全二叉树的定义可知,对于有n个结点的深度为k的完全二叉树有:2k-1 < n ≤ 2k+1-1 移项有:2k < n+1 ≤ 2k+1 对不等式求对数,有:k < lb(n+1) ≤ k+1 因为lb(n+1)介于k和k+1之间且大于k,而二叉树的深度又只能是整数,所以必有k为大于或等于lb(n+1)-1的最小整数。 可简写为k=lb(n+1)-1。例如,2.0=2,2.1=3。 若结点个数n=0,则有深度k=-1,满足k=lb(0+1)-1=-1; 若结点个数n=1,则有深度k=0,满足k=lb(1+1)-1=0; 若结点个数n=2,则有深度k=1,满足k=lb(2+1)-1 =0.xx =1; 若结点个数n=3,则有深度k=1,满足k=lb(3+1)-1=1。
性质5 对于一棵有n个结点的完全二叉树,按照从上至下和从左至右的顺序对所有结点从0开始顺序编号,则对于序号为i的结点(0≤i < n),有: (1)如果i>0,则其双亲是结点(i-1)/2(“/”表示整除) ;如果i=0,则结点i是根结点,无双亲。 (2)如果2i+1<n ,其左孩子是结点2i+1;如果2i+1≥n,则结点i无左孩子。 (3)如果2i+2<n,其右孩子是结点2i+2;如果2i+2≥n,则结点i无右孩子。
8.3二叉树的设计和实现 8.3.1二叉树的存储结构 二叉树的存储结构主要有三种:顺序存储结构、链式存储结构和仿真指针存储结构。 1. 二叉树的顺序存储结构 完全二叉树的结点可按从上至下和从左至右的次序存储在一维数组中,其结点之间的关系可由公式计算得到,这就是二叉树的顺序存储结构。下面两棵树在数组中的存储结构分别为:
A B C D F G H I J K L M N O E 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 A B C E F G D O H I J K L M N
A B C E F G D H I J A B C D F G H I J E 0 1 2 3 4 5 6 7 8 9 对于一般的非完全二叉树显然不能直接使用二叉树的顺序存储结构。可以首先在非完全二叉树中增添一些并不存在的空结点使之变成完全二叉树的形态,然后再用顺序存储结构存储。
A A B C B C D E D E G G F F ∧ ∧ ∧ ∧ ∧ ∧ 数组 A B C E F G D 下标 0 1 2 3 4 5 6 7 8 9 10 11 12 (b)完全二叉树形态 (a)一般二叉树 (c) 在数组中的存储形式
leftChild data rightChild 2. 二叉树的链式存储结构 二叉树的链式存储结构是用指针建立二叉树中结点之间的关系。二叉树最常用的的链式存储结构是二叉链。二叉链存储结构的每个结点包含三个域,分别是数据域data、左孩子指针域leftChild和右孩子指针域rightChild。二叉链存储结构中每个结点的图示结构为: 二叉链存储结构的二叉树也有不带头结点和带头结点两种。带头结点的二叉链存储结构的二叉树见下图(b),不带头结点的二叉链存储结构的二叉树如下图(a)所示。
root root ∧ A A B C ∧ B C ∧ D E F ∧ ∧ ∧ ∧ ∧ D E F ∧ ∧ ∧ ∧ ∧ G ∧ ∧ G ∧ ∧ (b)带头结点的二叉树 (a)不带头结点的二叉树 图8-10 二叉链存储结构的二叉树
3.二叉树的仿真指针 二叉树的仿真指针存储结构是用数组存储二叉树中的结点,数组中每个结点除数据元素域外,再增加仿真指针域用于仿真常规指针建立二叉树中结点之间的关系。 二叉树的仿真二叉链存储结构
8.3.2二叉链结构的二叉树设计 typedef struct Node { DataType data; struct Node *leftChild; struct Node *rightChild; }BiTreeNode; /*初始化*/ void Initiate(BiTreeNode **root) { *root = (BiTreeNode *)malloc(sizeof(BiTreeNode)); (*root)->leftChild = NULL; (*root)->rightChild = NULL; }
/*左子树插入结点*/ BiTreeNode *InsertLeftNode(BiTreeNode *curr, DataType x) { BiTreeNode *s, *t; if(curr == NULL) return NULL; t = curr->leftChild; s = (BiTreeNode *)malloc(sizeof(BiTreeNode)); s->data = x; s->leftChild = t; s->rightChild = NULL; curr->leftChild = s; return curr->leftChild; }
/*删除左子树*/ BiTreeNode *DeleteLeftTree(BiTreeNode *curr) { if(curr == NULL || curr->leftChild == NULL) return NULL; Destroy(&curr->leftChild); curr->leftChild = NULL; return curr; }
例8-1 编写一个建立如图8-10(b)所示的带头结点的二叉链存储结构二叉树的程序。 #include <stdlib.h> #include <stdio.h> typedef char DataType; #include "Bitree.h“ Void main(void) { BiTreeNode *root, *p, *pp; Initiate(&root); p = InsertLeftNode(root, 'A'); p = InsertLeftNode(p, 'B'); p = InsertLeftNode(p, 'D'); p = InsertRightNode(p, 'G'); p = InsertRightNode(root->leftChild, 'C'); InsertLeftNode(p, 'E'); InsertRightNode(pp, 'F'); }
8.4 二叉树遍历 8.4.1 二叉树遍历 1.二叉树遍历的基本方法 从二叉树的定义知,一棵二叉树由三部分组成:根结点、左子树和右子树。若规定D,L,R分别代表“访问根结点”、“遍历根结点的左子树”和“遍历根结点的右子树”,根据遍历算法对访问根结点处理的位置,称下面三种遍历算法分别为前序遍历(DLR)、中序遍历(LDR)和后序遍历(LRD)。
前序遍历(DLR)递归算法为: 若二叉树为空则算法结束;否则: (1)访问根结点; (2)前序遍历根结点的左子树; (3)前序遍历根结点的右子树。 对于图8-7(b)所示的二叉树,前序遍历访问结点的次序为: A B D G C E F
中序遍历(LDR)递归算法为: 若二叉树为空则算法结束;否则: (1)中序遍历根结点的左子树; (2)访问根结点; (3)中序遍历根结点的右子树。 对于图8-7(b)所示的二叉树,中序遍历访问结点的次序为: D G B A E C F
后序遍历(LRD)递归算法为: 若二叉树为空则算法结束;否则: (1)后序遍历根结点的左子树; (2)后序遍历根结点的右子树; (3)访问根结点。 对于图8-7(b)所示的二叉树,后序遍历访问结点的次序为: G D B E F C A
此外,二叉树还有层序遍历。层序遍历的要求是:按二叉树的层序次序(即从根结点层至叶结点层),同一层中按先左子树再右子树的次序遍历二叉树。此外,二叉树还有层序遍历。层序遍历的要求是:按二叉树的层序次序(即从根结点层至叶结点层),同一层中按先左子树再右子树的次序遍历二叉树。 它的特点是,在所有未被访问结点的集合中,排列在已访问结点集合中最前面结点的左子树的根结点将最先被访问,然后是该结点的右子树的根结点。这样,如果把已访问的结点放在一个队列中,那么,所有未被访问结点的访问次序就可以由存放在队列中的已访问结点的出队列次序决定。因此可以借助队列实现二叉树的层序遍历。
二叉树的层序遍历算法如下: (1)初始化设置一个队列; (2)把根结点指针入队列; (3)当队列非空时,循环执行步骤(3.a)到步骤(3.c); (3.a)出队列取得一个结点指针,访问该结点; (3.b)若该结点的左子树非空,则将该结点的左子树指 针入队列; (3.c)若该结点的右子树非空,则将该结点的右子树指 针入队列; (4)结束。
当对一个二叉树用一种特定的遍历方法来遍历时,其遍历序列一定是线性的,且是惟一的。 2.二叉树的遍历方法和二叉树的结构 二叉树是非线性结构,每个结点会有零个、一个或两个孩子结点,一个二叉树的遍历序列不能决定一棵二叉树,但某些不同的遍历序列组合可以惟一确定一棵二叉树。可以证明,给定一棵二叉树的前序遍历序列和中序遍历序列可以惟一确定一棵二叉树的结构。
8.4.2 二叉链存储结构下二叉树遍历的实现 void PreOrder(BiTreeNode *t, void Visit(DataType item)) /*前序遍历二叉树t,访问操作为Visit()函数*/ { if(t != NULL) { Visit(t->data); PreOrder(t->leftChild, Visit); PreOrder(t->rightChild, Visit); } } 为了通用性,把访问操作设计成前序遍历二叉树函数的一个函数虚参 Visit()。
void InOrder(BiTreeNode *t, void Visit(DataType item)) /*中序t */ { if(t != NULL) { InOrder(t->leftChild, Visit); Visit(t->data); InOrder(t->rightChild, Visit); } } void PostOrder(BiTreeNode *t, void Visit(DataType item)) /*后序 */ { if(t != NULL) { PostOrder(t->leftChild, Visit); PostOrder(t->rightChild, Visit); Visit(t->data); } }
二叉树撤消操作函数 二叉树的撤消操作实际上是二叉树遍历操作的一个具体应用。由于二叉树中每个结点允许有左孩子结点和右孩子结点,所以在释放某个结点的存储空间前必须先释放该结点左孩子结点的存储空间和右孩子结点的存储空间,因此,二叉树撤消操作必须是后序遍历的具体应用。撤消操作算法实现如下:
void Destroy(BiTreeNode **root) { if((*root) != NULL && (*root)->leftChild != NULL) Destroy(&(*root)->leftChild); if((*root) != NULL && (*root)->rightChild != NULL) Destroy(&(*root)->rightChild); free(*root); }
8.4.3 二叉树遍历的应用 1 打印二叉树 把二叉树逆时针旋转900C,按照二叉树的凹入表示法打印二叉树。可把此函数设计成递归函数。由于把二叉树逆时针旋转900C后,在屏幕上方的首先是右子树,然后是根结点,最后是左子树,所以打印二叉树算法是一种特殊的中序遍历算法。
void PrintBiTree(BiTreeNode *bt, int n) { int i; if(bt == NULL) return; PrintBiTree(bt->rightChild, n+1); for(i = 0; i < n-1; i++) printf(" "); if(n > 0) { printf("---"); printf("%c\n", bt->data); } PrintBiTree(bt->leftChild, n+1); }
2 查找数据元素 在二叉树中查找数据元素操作的要求是:在bt为根结点指针的二叉树中查找数据元素x,若查找到数据元素x时返回该结点的指针;若查找不到数据元素x时返回空指针。 在二叉树bt中查找数据元素x算法可设计成先序遍历算法,此时查找结点的次序是:首先在根结点查找,然后在左子树查找,最后在右子树查找。但是,和常规递归算法不同的是,此算法当一个分支上的结点比较完仍未查找到数据元素x时,要返回到该结点的双亲结点处继续查找。因此,此算法是一个回溯算法 。
BiTreeNode *Search(BiTreeNode *bt, DataType x) { BiTreeNode *p; if(bt == NULL) return NULL; if(bt->data == x) return bt; if(bt->leftChild != NULL) { p = Search(bt->leftChild, x); if(p != NULL) return p; } if(bt->rightChild != NULL) { p = Search(bt->rightChild, x); if(p != NULL) return p; } return NULL; }
3.应用举例 例8-2 编写一个程序,首先建立如图8-10(b)所示的带头结点的二叉链存储结构二叉树,然后打印该二叉树,最后输出分别按照前序遍历二叉树次序、中序遍历二叉树次序和后序遍历二叉树次序访问各结点的序列信息。 设计: 输出显示函数设计:按照某种遍历方法输出显示二叉树各结点的信息,其实就是把上述各遍历二叉树函数中的Visit()函数设计成输出显示结点信息的函数。Visit()函数设计如下: void Visit(DataType item) { printf("%c ", item); }
8.4.4.非递归的二叉树遍历算法 所有递归算法都可以借助堆栈转换成循环结构的非递归算法,通常有两种方法:一种方法是形式化模拟转换,另一种方法是根据要求解问题的特点设计借助堆栈的循环结构算法。 非递归的二叉树前序遍历算法如下: (1)初始化设置一个堆栈; (2)把根结点指针入栈; (3)当堆栈非空时,循环执行步骤(3.a)到步骤(3.c); (3.a)出栈取得一个结点指针,访问该结点; (3.b)若该结点的右子树非空,则将该结点的右子树指 针入栈; (3.c)若该结点的左子树非空,则将该结点的左子树指 针入栈; (4)结束。
问题: (1)这个算法和哪个算法相似? (2)为什么相似? (3)非递归的二叉树前序遍历算法有什么用途?
8.5 线索二叉树 线索二叉树是另一种分步遍历二叉树的方法。它既可以从前向后分步遍历二叉树,又可以从后向前分步遍历二叉树。 当按某种规则遍历二叉树时,保存遍历时得到的结点的后继结点信息和前驱结点信息的最常用的方法是建立线索二叉树。 对二叉链存储结构的二叉树分析可知,在有n个结点的二叉树中必定存在n+1个空链域。