1.04k likes | 1.26k Views
数据结构. 树. 第 6 章 树和二叉树. 知 识 点 二叉树及二叉树的存储结构 二叉树的遍历 树的基本概念 哈夫曼树 难 点 二叉树遍历算法的设计 修改二叉树遍历算法,进行二叉树其它相关的操作,解决实际应用问题. 第 6 章 树和二叉树. 要 求 熟练掌握以下内容 : 理解树形结构的基本概念和术语 二叉树定义和存储结构 二叉树的遍历次序及二叉树遍历算法 了解以下内容: 树和二叉树之间的相互转换方法 线索二叉树的建立及遍历算法 树的应用:哈夫曼树. 第 6 章 树和二叉树. 6.1 树的定义和基本术语
E N D
数据结构 树
第 6 章 树和二叉树 • 知 识 点 • 二叉树及二叉树的存储结构 • 二叉树的遍历 • 树的基本概念 • 哈夫曼树 • 难 点 • 二叉树遍历算法的设计 • 修改二叉树遍历算法,进行二叉树其它相关的操作,解决实际应用问题
第 6 章 树和二叉树 • 要 求 熟练掌握以下内容: • 理解树形结构的基本概念和术语 • 二叉树定义和存储结构 • 二叉树的遍历次序及二叉树遍历算法 了解以下内容: • 树和二叉树之间的相互转换方法 • 线索二叉树的建立及遍历算法 • 树的应用:哈夫曼树
第 6 章 树和二叉树 6.1 树的定义和基本术语 6.2 二叉树 6.3 遍历二叉树和线索二叉树 6.4 树和森林 6.5 赫夫曼树及其应用
6.1 树的定义和基本术语 6.1.1 树的定义 • 树是n个结点的有限集合T,在一棵非空树中(n>0)有且仅有一个称作根的结点;其余结点可分为m个(m≥0)互不相交的集合T1,T2……Tm,其中,每一个集合本身又是一棵树,并称为根的子树。 • 当n=0时,称为空树。 • 有限集合T1,T2……Tm应该“互不相交”,即任意两个集合不能有相重的结点。 • 树的各个结点有不同层次关系,这种关系通常用图形表示,但与自然界的树木相反,习惯上将整棵树的根画在最上层。树的结构参见图6-1。
6.1.2 基本术语 • 1.结点:树的结点包含一个数据元素及若干指向其子树的分支 • 2.结点的度:树中每个结点具有的子树数或者后继结点数称为该结点的度(Degree)。度数为0的结点,即没有子树的结点叫作终端结点或叶子结点。除叶子结点外的所有结点,为分支结点,也叫非终端结点。(度不为0的结点)一棵树中各个结点度数的最大值叫做这个树的度。
3. 孩子结点和双亲结点:一个结点的子树的根或者后继结点称为该结点的孩子结点,反之,该结点则称为其后继结点的双亲结点。 • 4. 兄弟结点:同一个结点的孩子结点之间互称为兄弟结点。 • 5. 子孙结点和祖先结点:一个结点的子树中所有结点均称之为该结点的子孙结点。反之,从根结点到达一个结点的路径上的所有结点,都叫做该结点的祖先结点。
6. 树的深度:树是一种层次结构,树中结点的层次(Level)是从根结点算起的。根结点为第一层,其儿子结点为第二层。其余各结点的层数逐层由上而下计算。一棵树中结点的最大层数叫做此树的深度或高度。 • 7.有序树 若一棵树中所有子树从左到右的排序是有顺序的,不能颠倒次序。称该树为有序树。 • 8. 无序树 若一棵树中所有子树的次序无关紧要,则称为无序树。9. 森林:若干棵互不相交的树组成的集合为森林。一棵树可以看成是一个特殊的森林。
树形结构的逻辑特征 • 树形结构的逻辑特征可用树中结点之间的父子关系来描述: • 树中任一结点都可以有零个或多个直接后继结点(即儿子结点),但至多只能有一个直接前趋结点(即父亲结点)。 • 树中只有根结点无前趋,它是开始结点; • 叶结点无后继,它们是终端结点。 • 树形结构是非线性结构。
6.2 二叉树 6.2.1 二叉树的定义 6.2.2 二叉树的性质 6.2.3 二叉树的存储结构
6.2.1 二叉树的定义 和树结构定义类似,二叉树的定义也可以递归形式给出: 二叉树是n(n≥0)个结点的有限集,它或者是空集(n=0),或者由一个根结点及两棵不相交的左子树和右子树组成。 二叉树的特点是每个结点最多有两个孩子,或者说,在二叉树中不存在度大于2的结点,并且二叉树是有序树(树为无序树),其子树的顺序不能颠倒。因此,二叉树有五种不同的形态。
二叉树的五种基本形态 (a) 空二叉树 (b) 仅有一个根结点的二叉树 (c) 右子树为空的二叉树 (d) 左子树为空的二叉树 (e) 左、右子树均非空的二叉树
6.2.2 二叉树的性质 性质1 若二叉树的层数从1开始,则二叉树的第i层结点数,最多为2i-1个(i≥1)。 20=1 21=2 22=4 23=8
性质2 深度(高度)为k的二叉树最大结点数为2k-1(k≥1)。 证明:最大结点个数=20+21+22+……+2k-1 =2k-1
性质3 对任意一棵二叉树,如果叶子结点个数为n0,度为2的结点个数为n2,则有n0=n2+1。 证明:设n0,n1和n2分别为二叉树中度为0,度为1和度为2的结点个数,则二叉树中总的结点个数n满足: n=n0+n1+n2 ① 再有除了根结点之外,每个结点都由一个分支射入,则分支数B与总的结点数之间的关系为: n=B+1 ② 另外,由于这些分支是由度为1或2的结点射出的,则有 B=n1+2n2 ③ 则由上三式得: n0=n2+1
满二叉树 • 在一个二叉树中,若第i层的结点数为2i-1,则称此层的结点数是满的,当树中的每一层都是满的,则称此二叉树为满二叉树。 • 即如果一个二叉树中,除最下一层的各结点度数为0以外,其它各层结点的度数均等于2,则此二叉树为满二叉树。 • 满二叉树的第一层有一个结点(即根结点),第二层有两个结点,依此类推。每一层的结点数都是上一层结点数的二倍。所以,在满二叉树的第i层共有2i-1个结点(i≥1),一个深度为h的满二叉树的结点总数为2h-1。
完全二叉树 • 如果一个二叉树各层都是“满”的,只是最下面一层从右边起连续缺n个结点,这种二叉树叫做完全二叉树。 • 例如图6.3中的满二叉树,如果缺少从第11号至第15号结点(没有图中虚框里的几个结点),就是一个完全二叉树。 • 设完全二叉树的结点数为n,它与树的深度之间的关系为: 2h-1-1<n≤ 2h-1 即n值大于深度为h-1的满二叉树的结点数,但小于或等于深度为h的满二叉树的结点数。
对于完全二叉树,对其结点采用“按层编号”比较方便,即从根结点开始由上而下逐层给结点编号,同一层的结点由左向右编号。 • 对于完全二叉树中任一个编号为i的结点(1≤i≤n),它的父结点和左、右儿子结点的编号与i值有如下的关系: • 1) 如果i=1,则它是整个树的根结点,无父结点;若i>1,则其父结点编号为 。 • 2) 如果2i≤n,则其左儿子结点编号为2i;若2i>n,则无左儿子结点。 • 3) 如果(2i+1)≤n,则其右儿子结点编号为(2i+1);反之,则无右儿子结点。
6.2.3 二叉树的存储结构 1.顺序存储结构 2.链式存储结构
1.顺序存储结构 思想: 用一个一维数组来存储二叉树的各个结点 C语言表示 #define MAX_TREE_SIZE 100//二叉树的最大结点数 typedef TElemType SqBiTree[MAX_TREE_SIZE]; //0号单元存储根结点 SqBiTree bt;
分析: 显然,二叉树的结点必须按某种次序分别存入数组的各个单元,这种次序应能反映结点间的逻辑关系,否则二叉树上的各种基本运算在顺序存储结构上很难实现。 对于完全二叉树来说,可以采用“以编号为地址”的方法,将编号为i的结点存入一维数组的第i个单元(下标为i-1)。
完全二叉树的顺序表示: 例: 对应的顺序存储结构: 下标
非完全二叉树的顺序表示: 例: 对应的顺序存储结构: 一维数组的21单元中只用上了7个.最坏情况下,一个深度为k且只有k个结点的单支树,却需要长度为2k-1的一维数组.
总结: 顺序存储结构适合存储完全二叉树 对于非完全二叉树,采用链式存储结构更合适
lchild data rchild 2. 二叉链表 结点结构: 通常每个结点中设置三个域,即值域、左指针域和右指针域,其结点结构如下: 其中data表示值域,用于存储放入结点的数据,lchild和rchild分别表示左指针域和右指针域,用以分别存储指向左儿子结点和右儿子结点的指针。
存储表示 typedef struct BiTNode { TElemType data; struct BiTNode *lchild, *rchild; } BiTNode, *BITree; 这里的TElemType可以是任何相应的数据类型如int、float或char等。
二叉链表 例: 链式存储:
lchild data 3. 三叉链表 通常每个结点中设置四个域,即值域、左指针域、右指针域和双亲指针域,其结点结构如下: 其中data表示值域,用于存储放入结点的数据,lchild和rchild分别表示左指针域和右指针域,用以分别存储指向左儿子结点和右儿子结点的指针,parent指向双亲结点。 rchild parent
6.3 遍历二叉树和线索二叉树6.3.1 遍历二叉树 定义:二叉树的遍历(Traverse)是指按一定的规律访问二叉树的每个结点,且每个结点只被访问一次的过程。 对二叉树的遍历过程实际上是将非线性结构的二叉树中的结点排列成一个线性序列的过程。 本节仅讨论二叉链表的遍历过程。
一个非空的二叉树由根结点及左、右子树这三个基本部分组成,因此若能依次遍历这三部分,便是遍历了整个二叉树。一个非空的二叉树由根结点及左、右子树这三个基本部分组成,因此若能依次遍历这三部分,便是遍历了整个二叉树。 在任一给定结点上,可以按某种次序执行三个操作:访问结点本身,遍历该结点左子树,遍历该结点右子树,操作排列次序: • ①左、根、右;③根、左、右;⑤左、右、根; • ②右、根、左;④根、右、左;⑥右、左、根; 由于实际问题一般都是要求左子树较右子树先遍历,故只采用其中①、③、⑤三种遍历次序,分别称为中序遍历、先序遍历和后序遍历。
三种遍历次序以递归的形式定义: (1) 中序(InOrder)遍历 若遍历的二叉树为空,执行空操作;否则依次执行下列操作: • 中序遍历左子树; • 访问根结点; • 中序遍历右子树。 (2) 先序(PreOrder)遍历 若遍历的二叉树为空,执行空操作;否则依次执行下列操作: • 访问根结点; • 先序遍历左子树; • 先序遍历右子树。
(3) 后序(PostOrder)遍历 若遍历的二叉树为空,执行空操作;否则依次执行下列操作: • 后序遍历左子树; • 后序遍历右子树; • 访问根结点。
二叉树遍历举例 • 中序遍历序列: • 先序遍历序列: • 后序遍历序列: HDIBEAFCG ABDHIECFG HIDEBFGCA
中序遍历递归算法 void InOrder(BITree T) { if (T) { InOrder(T->lchild); visit(T->data); InOrder(T->rchild); } }
先序遍历递归算法 void PreOrder(BITree T) { if (T) { visit(T->data); PreOrder(T->lchild); PreOrder(T->rchild); } }
后序遍历递归算法 void PostOrder(BITree T) { if (T) { PostOrder(T->lchild); PostOrder(T->rchild); visit(T->data); } }
遍历算法的应用 二叉树的遍历算法是一个重要的应用 注意: 1.理解访问根结点的意义 2.对具体问题需要考虑遍历的顺序
1.先序创建二叉链表 Status CreateBiTree(BITree &T) { scanf(&ch); if(ch==‘’) T=Null; else { if (!(T=(BiTNode *)malloc(sizeof(BiTNode)))) exit (OVERFLOW); T->data=ch; CreateBiTree (T->lchild); CreateBiTree (T->rchild); } return OK; }
2.输出二叉树的结点 void PreOrder(BITree T) { if (T) { printf(T->data); PreOrder(T->lchild); PreOrder(T->rchild); } }
3.输出二叉树的叶子结点 void PreOrder(BITree T) { if (T) {if(T->lchild==NULL&&T->rchild==NULL) printf(T->data); PreOrder(T->lchild); PreOrder(T->rchild); } }
4.统计二叉树的叶子结点个数 int n=0; void leafcount(BITree T) { if (T) {if(T->lchild==NULL&&T->rchild==NULL) n++; leafcount (T->lchild); leafcount (T->rchild); } }
练习 1. 假设二叉树包含的结点数据为1,3,7,2,12. (1)画出两棵高度最大的二叉树。 (2)画出两棵完全二叉树,要求每个双亲结点的值大于其孩子结点的值。
练习 1. 假设二叉树包含的结点数据为1,3,7,2,12. (1)画出两棵高度最大的二叉树。 (2)画出两棵完全二叉树,要求每个双亲结点的值大于其孩子结点的值。