1.43k likes | 1.53k Views
6.1 树的定义和基本术语 6.2 二叉树 6.3 遍历二叉树和线索二叉树 6.4 树和森林 6.6 赫夫曼树及其应用. 第六章 树和二叉树. 树 ( Tree ) 是 n ( n ≥0 ) 个结点的有限集。 当 n =0 时, 称为空树;当 n >0 时,该集合满足如下条件: 其中必有一个称为 根 ( root )的特定结点,它没有直接前驱,但有零个或多个直接后继。
E N D
6.1树的定义和基本术语 6.2二叉树 6.3遍历二叉树和线索二叉树 6.4树和森林 6.6赫夫曼树及其应用 第六章 树和二叉树
树(Tree)是n(n≥0)个结点的有限集。当n=0时, 称为空树;当n>0时,该集合满足如下条件: 其中必有一个称为根(root)的特定结点,它没有直接前驱,但有零个或多个直接后继。 当n>1时,其余结点可以划分成m(m>0)个互不相交的有限集T1,T2,T3,…,Tm,其中Ti(1≤i ≤ m)又是一棵树,称为根的子树(SubTree)。 6.1树的定义和基本术语
层次 1 2 3 4 A B C A G D E F H I (b) 一般的树 (a) 只有根结点的树 图6.1 树的图示方法
树的结点包含一个数据元素及若干指向其子树的分支。 结点的度:一个结点的子树个数称为此结点的度。 叶子或终端结点:度为0的结点,即无后继的结点。 分支结点或非终端结点:度不为0的结点。 孩子结点:一个结点的直接后继称为该结点的孩子结点。在图6.1(b)中, B、C是A的孩子。 双亲结点:一个结点的直接前驱称为该结点的双亲结点。在图6.1(b)中,A 是B、C的双亲。 兄弟结点:同一双亲结点的孩子结点之间互称兄弟结点。在图6.1(b)中,结点H、I互为兄弟结点。
祖先结点:一个结点的祖先结点是指从根结点到该结点的路径上的所有结点。在图6.1(b)中,结点H的祖先是A、B、E。祖先结点:一个结点的祖先结点是指从根结点到该结点的路径上的所有结点。在图6.1(b)中,结点H的祖先是A、B、E。 子孙结点:一个结点的直接后继和间接后继称为该结点的子孙结点。在图6.1(b)中,结点B的子孙是D、E 、F、H、I。 树的度:树中所有结点的度的最大值。 结点的层次:从根结点开始定义,根结点的层次为1,根的直接后继的层次为2,依此类推(见图6.1(b))。 树的高度(深度):树中所有结点的层次的最大值。 有序树:在树T中,如果各子树Ti之间是有先后次序的(即不能互换),则称为有序树。 森林:m(m≥0)棵互不相交的树的集合。将一棵非空树的根结点删去,树就变成一个森林;反之,给森林增加一个统一的根结点,森林就变成一棵树。
ADT Tree { 数据对象D:D是具有相同特性的数据元素的集合。 数据关系R:若D为空集,则称为空树。若D中仅含有一个数据元素,则R为空集,否则R={H},H是如下的二元关系: 在D中存在唯一的称为根的数据元素root,它在关系H下没有前驱。 除root以外,D中每个结点在关系H下都有且仅有一个前驱。
基本操作 P: • InitTree(&T): 将T初始化为一棵空树。 • DestoryTree (&T): 树T存在,销毁树T。 • CreateTree (&T, definition): 按definition创建树T。 • ClearTree(&T): 树T存在,将树T清为空树。 • TreeEmpty(T): 树T存在,若T为空则返回TRUE,否则返回FALSE。 • TreeDepth(T): 树T存在,返回T的深度。 • Root(T): 树T存在,返回树T的根。
Value(T, cur_e):树T存在,cur_e是T中某个结点,返回cur_e的值。 • Assign(T, cur_e, value): 树T存在, cur_e是T中的某个结点,结点cur_e赋值为value。 • Parent(T, cur_e):树T存在, cur_e是T中的某个结点。cur_e为非根结点,则返回它的双亲,否则函数值为“空”。 • LeftChild(T, cur_e):树T存在,cur_e是T中的某个结点。若cur_e为非叶子结点,则返回它的最左孩子,否则返回“空”。 • RightSibling(T, cur_e):树T存在,cur_e是T中的某个结点。若cur_e有右兄弟,则返回它的右兄弟,否则函数值为“空”。
InsertChild(&T, &p, i, c): 树T存在,p指向T中某个结点。非空树c与T不相交。插入c为T中p指向结点的第i棵子树。 DeleteChild(&T, &p, i): 树T存在,p指向T中某个结点, 1≤i≤p所指向结点的度。删除T中p所指向结点的第i棵子树。 TraverseTree(T,visit()):树T存在,visit()是对结点进行访问的函数。按照某种次序对树T的每个结点调用visit()函数访问一次且最多一次。若visit()失败,则操作失败。 } ADT Tree
树的表示方法 树的表示形式有多种, 常见的几种方法是: (1) 倒挂树法, 如图6.1所示。 (2) 文氏图法(集合包含关系), 如图6.2(a)所示。 (3) 凹入表示法, 如图6.2(b)所示。 (4) 嵌套括号法,如(A(B(D,E(H,I),F),C(G)))。
6.1树的定义和基本术语 6.2二叉树 6.3遍历二叉树和线索二叉树 6.4树和森林 6.6赫夫曼树及其应用 第六章 树和二叉树
6.2.1二叉树的定义与基本操作 • 二叉树(Binary Tree)是另一种树型结构,其特点是: • 每个结点的度都不大于2; • 每个结点的孩子结点次序不能任意颠倒。 • 即一个二叉树中的每个结点只能含有0、 1或2个孩子,而且每个孩子有左右之分。我们把位于左边的孩子叫做左孩子,位于右边的孩子叫做右孩子。
A A A B A B B C (c) 根和左子树 (b) 根和空的左右子树 (a) 空二叉树 (d) 根和右子树 (e) 根和左右子树 图6.3 二叉树的5种基本形态 二叉树的基本操作与树的基本操作类似(见p.121),有关树的术语也都适用于二叉树。
6.2.2二叉树的性质 性质1:在二叉树的第i层上至多有2i-1个结点(i≥1)。 证明:用数学归纳法。 归纳基础:当i=1时,整个二叉树只有一根结点,此时2i-1=20=1,结论成立。 归纳假设:假设i=k时结论成立,即第k层上结点总数最多为2k-1个。 现证明当i=k+1时,结论成立:因为二叉树中每个结点的度最大为2,则第k+1层的结点总数最多为第k层上结点最大数的2倍,即2×2k-1=2(k+1)-1,故结论成立。
性质2:深度为k的二叉树至多有2k-1个结点(k≥1)。性质2:深度为k的二叉树至多有2k-1个结点(k≥1)。 证明:因为深度为k的二叉树,其结点总数的最大值是将二叉树每层上结点的最大值相加,所以深度为k的二叉树的结点总数至多为 故结论成立。
性质3:对任意一棵二叉树T,若终端结点数为n0,而其度数为2的结点数为n2,则n0=n2+1。性质3:对任意一棵二叉树T,若终端结点数为n0,而其度数为2的结点数为n2,则n0=n2+1。 证明:设二叉树中结点总数为n,n1为二叉树中度为1的结点总数。 因为二叉树中所有结点的度小于等于2,所以有n=n0+n1+n2 设二叉树中分支数目为B,因为除根结点外,每个结点均对应一个进入它的分支,所以有n=B+1
又因为二叉树中的分支都是由度为1和度为2的结点发出, 所以分支数目为 B=n1+2n2 整理上述两式可得到 n=B+1=n1+2n2+1 将n=n0+n1+n2代入上式,得出n0+n1+n2=n1+2n2+1,整理后得n0=n2+1,故结论成立。
满二叉树: 深度为k且有2k-1个结点的二叉树。在满二叉树中,每层结点都是满的,即每层结点都具有最大结点数。图6.3(a)所示的二叉树,即为一棵满二叉树。 满二叉树的顺序表示,即从二叉树的根开始,层间从上到下,层内从左到右,逐层进行编号(1,2,…,n)。例如图6.3(a)所示的满二叉树的顺序表示为(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15)。
完全二叉树: 深度为k,结点数为n的二叉树,如果其结点1至n的位置序号分别与深度为k的满二叉树的结点1至n的位置序号一一对应,则为完全二叉树, 如图6.3(b)所示。 满二叉树必为完全二叉树, 而完全二叉树不一定是满二叉树。
1 1 2 3 2 3 4 5 6 7 4 5 6 7 8 9 10 11 12 13 14 15 8 9 10 11 12 13 14 (a)满二叉树 (b)完全二叉树 图6.4满二叉树与完全二叉树
性质4:具有n个结点的完全二叉树的深度为 +1。 证明:假设n个结点的完全二叉树的深度为k,根据性质2可知,k-1层满二叉树的结点总数为 n1=2k-1-1 k层满二叉树的结点总数为 n2=2k-1 显然有n1<n≤n2,进一步可以推出n1+1≤n<n2+1。 将n1=2k-1-1和n2=2k-1代入上式,可得2k-1≤n<2k,即k-1≤log2n<k。因为k是整数,所以k-1= ,k= +1, 故结论成立。
性质5:如果对一棵有n个结点的完全二叉树的结点按层序编号(从第1层到第 +1层,每层从左到右),则对任一结点i(1≤i≤n),有: (1)如果i=1,则结点i无双亲,是二叉树的根;如果i>1,则其双亲是结点 。 (2)如果n<2i,则结点i无左孩子;否则,其左孩子是结点2i。 (3)如果n<2i+1,则结点i无右孩子;否则,其右孩子是结点2i+1。
可以用归纳法证明其中的(2)和(3): 归纳基础:当i=1时,由完全二叉树的定义知,如果n≥2×i=2,说明二叉树中存在两个或两个以上的结点,所以其左孩子存在且序号为2;反之,如果n < 2,说明二叉树中不存在序号为2的结点,其左孩子不存在。同理,如果n ≥2×i+1=3,说明其右孩子存在且序号为3;如果n < 3,则二叉树中不存在序号为3的结点,其右孩子不存在。 归纳假设:假设对于序号为j(1≤j≤i)的结点,当n≥2×j时,其左孩子存在且序号为2×j,当n <2×j时,其左孩子不存在;当n≥2×j+1时,其右孩子存在且序号为2×j+1,当n <2×j+1时,其右孩子不存在。
当i=j+1时,根据完全二叉树的定义,若其左孩子存在, 则其左孩子结点的序号一定等于序号为j的结点的右孩子的序号加1,即其左孩子结点的序号等于(2×j+1)+1=2(j+1)=2×i,且有n≥2×i;如果n <2×i,则左孩子不存在。若右孩子结点存在,则其右孩子结点的序号应等于其左孩子结点的序号加1,即右孩子结点的序号为2×i+1,且有n≥2×i+1;如果n <2×i+1,则右孩子不存在。 故(2)和(3)得证。
由(2)和(3)我们可以很容易证明(1)。 当i=1时,显然该结点为根结点,无双亲结点。当i>1时,设序号为i的结点的双亲结点的序号为m,如果序号为i的结点是其双亲结点的左孩子,根据(2)有i=2×m,即m=i/2; 如果序号为i的结点是其双亲结点的右孩子,根据(3)有i=2×m+1, 即m=(i-1)/2=i/2-1/2,综合这两种情况,可以得到,当i>1时,其双亲结点的序号等于 。证毕。
6.2.3二叉树的存储结构 1.顺序存储结构 用一组地址连续的存储单元依次自上而下、自左至右存储完全二叉树的结点元素,即将完全二叉树上编号为i的结点存储在如下定义的一维数组中下标为i-1的分量中。 //--------------二叉树的顺序存储表示-------------// #define MAX_TREE_SIZE 100 typedef TElemType SqBiTree[MAX_TREE_SIZE]; SqBiTree bt;
A B C D E F G H I J K L (a)完全二叉树 A B C D E F G H I J K L (b)二叉树的顺序存储结构 图6.5完全二叉树及其顺序存储结构
对于一般二叉树,则应将其每个结点与完全二叉树上的结点相对照,存储在一维数组的相应分量中。对于一般二叉树,则应将其每个结点与完全二叉树上的结点相对照,存储在一维数组的相应分量中。
A B C A B C D D (b)单支二叉树的顺序存储结构 (a) 单支二叉树 图6.6单支二叉树及其顺序存储结构 从树根起,自上层至下层,每层自左至右的给所有结点编号的缺点是有可能对存储空间造成极大的浪费。在最坏的情况下,一个深度为H且只有H个结点的右单支树却需要2H-1个结点存储空间。而且,若经常需要插入与删除树中结点时,顺序存储方式不是很好。
2.链式存储结构 对于任意的二叉树来说,每个结点只有两个孩子结点和一个双亲结点。我们可以设计每个结点至少包括三个域:数据域、左孩子域和右孩子域: 其中,lchild域指向该结点的左孩子,data域记录该结点的信息,rchild域指向该结点的右孩子。这样的结点结构所得的二叉树的存储结构称为二叉链表。
用C语言可以这样声明二叉树的二叉链表结点的结构:用C语言可以这样声明二叉树的二叉链表结点的结构: typedef struct BiTNode { TelemType data; struct BiTNode *lchild,*rchild; } BiTNode,*BiTree; 有时,为了便于找到双亲结点,可以增加一个parent域,parent域指向该结点的双亲结点,这种结点的结构(所得二叉树的存储结构称为三叉链表)如下:
A A B C B C D E F D E F G G (a) 二叉树T (b) 二叉树T的二叉链表 链表的头指针 图6.7 二叉树和二叉链表
容易证得,若一个二叉树含有n个结点,则它的二叉链表中必含有2n个指针域,其中必有n+1个空的链域。容易证得,若一个二叉树含有n个结点,则它的二叉链表中必含有2n个指针域,其中必有n+1个空的链域。 此结论证明如下: 证明:分支数目B=n-1,即非空的链域有n-1个,故空链域有2n-(n-1)=n+1个。 不同的存储结构实现二叉树的操作也不同。如要找某个结点的双亲结点,在三叉链表中很容易实现;在二叉链表中则需从根指针出发一一查找。可见,在具体应用中,需要根据二叉树的形态和需要进行的操作来决定二叉树的存储结构。
6.1树的定义和基本术语 6.2二叉树 6.3遍历二叉树和线索二叉树 6.4树和森林 6.6赫夫曼树及其应用 第六章 树和二叉树
6.3.1遍历二叉树 在二叉树的一些应用中,常常要求在树中查找具有某种特征的结点,或者对树中全部结点逐一进行某种处理。这就引入了遍历二叉树的问题,即如何按某条搜索路径巡访树中的每一个结点,使得每一个结点均被访问一次,且仅被访问一次。 假如以L、D、R分别表示遍历左子树、遍历根结点和遍历右子树,且规定先左后右,遍历整个二叉树则有三种遍历方案,分别规定为: DLR——先(根)序遍历, LDR——中(根)序遍历, LRD——后(根)序遍历。
1.先序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)访问根结点;(2)先序遍历左子树;(3)先序遍历右子树。 2.中序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)中序遍历左子树;(2)访问根结点;(3)中序遍历右子树。 3.后序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)后序遍历左子树;(2)后序遍历右子树;(3)访问根结点。
A B C E D G H F • 对于下图所示的二叉树, • 其先序、中序、后序遍历的序列如下: • 先序遍历: A、 B、 D、 F、 G、 C、 E、 H • 中序遍历: B、 F、 D、 G、 A、 C、 E、 H • 后序遍历: F、 G、 D、 B、 H、 E、 C、 A
例:如图6.9所示的二叉树表达式 (a+b*(c-d)-e/f) 若先序遍历此二叉树,按访问结点 的先后次序将结点排列起来, 其先序序列为: -+a*b-cd/ef 按中序遍历,其中序序列为: a+b*c-d-e/f 按后序遍历,其后序序列为: abcd-*+ef/- - / + f e * a - b d c 图6.9表达式(a+b*(c-d)-e/f)的二叉树
1. 中序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)中序遍历左子树; (2)访问根结点; (3)中序遍历右子树。 2. 中序遍历左子树时访问的第 一个结点是根结点的最左下方的 子孙结点B。 为找到此结点考虑使用栈,将 根结点、根结点的左孩子、左孩子的 左孩子、…直到该结点均压入栈中; 中序遍历二叉树(I) A C B G F E I H K J
弹出当前的栈顶元素(即B)并访问之 然后中序遍历结点B的右子树, 将结点B右子树的根结点压入栈中, 如果B没有右子树,则 先退栈弹出刚才压入的空指针,再次 退栈则访问该结点的上一层的 根结点A 3. 对以E为根的子树的中序遍历 过程与上述过程类似: 中序遍历二叉树(II) A C B G F E I H K J
首先找到该子树最左下方的 子孙结点(例如H),此过程通过 将子树根结点E、E的左孩子、 左孩子的左孩子、…均压入 栈来实现。 弹出当前的栈顶元素(即H) 并访问之 然后中序遍历结点H的右子树, 将H的右子树的根结点压入栈中, 如果H没有右子树,则先退栈弹出刚才 压入的空指针,再次退栈则访问该 结点的上一层的根结点E 中序遍历二叉树(III) A C B G F E I H K J
a c b e d Status InOrderTraverse(BiTree T, Status (*Visit)(TElemType e)) {//中序遍历二叉树的非递归算法 InitStack (S); Push(S, T); //根指针进栈 while (!StackEmpty(S)){ while (GetTop(S, p) && p) Push(S, p->lchild); // 向左走到尽头 Pop(S, p); // 空指针退栈 if (!StackEmpty(S)){//访问结点,向右一步 Pop(S, p); if (!Visit(p->data)) return ERROR; Push(S, p->rchild); } // if }// while return OK; } //InOrderTraverse 算法6.2
Status InOrderTraverse(BiTree T, Status (*Visit)(TElemType e)) {// 中序遍历二叉树的非递归算法,空指针不进栈 InitStack (S); p=T; while(p || !StackEmpty(S)){ //访问根结点后栈为空,此时p非空 if (p) { // 根指针进栈,遍历左子树// Push(S, p); p=p->lchild; } else { //根指针退栈,访问根结点,遍历右子树// Pop(S, p); if (!Visit(p->data)) return ERROR; p=p->rchild; }//else } //while return OK; } //InOrderTraverse 算法6.3
a c b e d Status PreOrderTraverse(BiTree T, Status (*Visit((TElemType e)) { //先序遍历二叉树的非递归算法 InitStack (S); Push(S, T); //根指针进栈 while (!StackEmpty(S)){ while (GetTop(S, p) && p) { if (!Visit(p->data)) return ERROR; Push(S, p->lchild); // 向左走到尽头 } Pop(S, p); // 空指针退栈 if (!StackEmpty(S)){//访问结点,向右一步 Pop(S, p); //中序:if (!Visit(p->data)) return ERROR; Push(S, p->rchild); } // if }// while return OK; } //PreOrderTraverse
Status PreOrderTraverse(BiTree T, Status (*Visit)(TElemType e)) {// 先序遍历二叉树的非递归算法 InitStack (S); p=T; while(p || !StackEmpty(S)){ if (p) { // 根指针进栈,遍历左子树// if (!Visit(p->data)) return ERROR; Push(S, p); p=p->lchild; } else { //根指针退栈,访问根结点,遍历右子树// Pop(S, p); //中序:if (!Visit(p->data)) return ERROR; p=p->rchild; }//else } //while return OK; } //PreOrderTraverse
遍历二叉树的算法中的基本操作是访问结点,因此不论按哪一种次序进行遍历,对含n个结点的二叉树,其时间复杂度为O(n)。遍历二叉树的算法中的基本操作是访问结点,因此不论按哪一种次序进行遍历,对含n个结点的二叉树,其时间复杂度为O(n)。 所需辅助空间为遍历过程中栈的最大容量,即树的深度,最坏情况下为n,则空间复杂度也为O(n)。
先序遍历二叉树的递归算法 void PreOrder(BiTree root) { /*先序遍历二叉树, root为指向二叉树(或某一子树)根结点的指针*/ if (root! =NULL) { Visit(root ->data);/*访问根结点*/ PreOrder(root ->lchild);/*先序遍历左子树*/ PreOrder(root ->rchild);/*先序遍历右子树*/ } }
中序遍历二叉树的递归算法 void InOrder(BiTree root) { /*中序遍历二叉树,root为指向二叉树(或某一子树)根结点的指针*/ if (root! =NULL) { InOrder(root ->lchild);/*中序遍历左子树*/ Visit(root ->data);/*访问根结点*/ InOrder(root ->rchild);/*中序遍历右子树*/ } }
后序遍历二叉树的递归算法 void PostOrder(BiTree root) { /* 后序遍历二叉树, root为指向二叉树(或某一子树)根结点的指针*/ if (root! =NULL) { PostOrder(root ->lchild); /*后序遍历左子树*/ PostOrder(root ->rchild); /*后序遍历右子树*/ Visit(root ->data); /*访问根结点*/ } }