1 / 29

数据结构与算法 Data Structure Algorithms 烟台南山学院信息科技学院 数据结构与算法教学组

数据结构与算法 Data Structure Algorithms 烟台南山学院信息科技学院 数据结构与算法教学组. 6.4 树和森林. 1. 树和森林与二叉树的转换 2. 树和森林的存储方式 3. 树和森林的遍历. 1. 树和森林与二叉树的转换. 讨论 1 :树如何转为二叉树?. 转换步骤: step1: 将树中同一结点的兄弟相连 ; step2: 保留结点的最左孩子连线,删除其它孩子连线; step3: 将同一孩子的连线绕左孩子旋转 45 度角。. 加线. 抹线. 旋转. 根结点肯定没有右孩子!. a. a. b. b. i.

abel-oliver
Download Presentation

数据结构与算法 Data Structure Algorithms 烟台南山学院信息科技学院 数据结构与算法教学组

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 数据结构与算法Data Structure Algorithms 烟台南山学院信息科技学院 数据结构与算法教学组

  2. 6.4 树和森林 1. 树和森林与二叉树的转换 2. 树和森林的存储方式 3. 树和森林的遍历

  3. 1. 树和森林与二叉树的转换 讨论1:树如何转为二叉树? 转换步骤: step1: 将树中同一结点的兄弟相连; step2: 保留结点的最左孩子连线,删除其它孩子连线; step3: 将同一孩子的连线绕左孩子旋转45度角。 加线 抹线 旋转

  4. 根结点肯定没有右孩子! a a b b i c c d i d e e f h g g f h 树转二叉树举例: 方法:加线—抹线—旋转 兄弟相连 长兄为父 孩子靠左

  5. a b c d i a e b i c f d e g h h g f 讨论2:二叉树怎样还原为树? 要点:把所有右孩子变为兄弟!

  6. 即F={T1, T2, …,Tm} B={root, LB, RB} 讨论3:森林如何转为二叉树? 法一: ① 各森林先各自转为二叉树; ② 依次连到前一个二叉树的右子树上。 法二:森林直接变兄弟,再转为二叉树 (参见教材P138图6.17,两种方法都有转换示意图)

  7. A B E C F G D H A A G G E E I B B H H C C D D I I F F J J J 森林转二叉树举例:(法二) A 兄弟相连 长兄为父 孩子靠左 头根为根

  8. 即B={root, LB, RB} F={T1, T2, …,Tm} A A B B E E C F C G F G D H A G E D H I I B H C D I F J J J 讨论4:二叉树如何还原为森林? 要点:把最右边的子树变为森林,其余右子树变为兄弟

  9. parents data data parents 1 结点结构 2 3 n 树结构 2. 树和森林的存储方式 树有三种常用存储方式: ①双亲表示法 ②孩子表示法 ③孩子兄弟表示法 1、用双亲表示法来存储 思路:用一组连续空间来存储树的结点,同时在每个结点中附设一个指示器,指示其双亲结点在链表中的位置。

  10. A B C G F D E H I 例1: 双亲表示法 -1 0 0 1 缺点:求结点的孩子时需要遍历整个结构。

  11. 1 c a b e b 2 d c 3 a d 4 b c g e 5 h f d e f 6 g 7 h g f h 8 2、用孩子表示法来存储 思路:将每个结点的孩子排列起来,形成一个带表头(装父结点)的线性表(n个结点要设立n个链表); 再将n个表头用数组存放起来,这样就形成一个混合结构。 例如:

  12. firstchild data nextsibling 3、用孩子兄弟表示法来存储 思路:用二叉链表来表示树,但链表中的两个指针域含义不同。 左指针指向该结点的第一个孩子; 右指针指向该结点的下一个兄弟结点。 指向右兄弟 指向左孩子

  13. a d a b c b c d e e h g f f g h 例如: 问:树转二叉树的“连线—抹线—旋转” 如何由计算机自动实现? 答:用“左孩子右兄弟”表示法来存储即可。 存储的过程就是转换的过程!

  14. A G E B H C D I F J 森林的遍历 • 先序遍历 • 若森林为空,返回; • 访问森林中第一棵树的根结点; • 先序遍历第一棵树中根结点的子树森林; • 先序遍历除去第一棵树之后剩余的树构成的森林。 • 中序遍历 • 若森林为空,返回; • 中序遍历森林中第一棵树的根结点的子树森林; • 访问第一棵树的根结点; • 中序遍历除去第一棵树之后剩余的树构成的森林。

  15. a c b g f e d 6.5 Huffman树及其应用 一、最优二叉树(霍夫曼树) 预备知识:若干术语 路 径: 路径长度: 树的路径长度: 带权路径长度: 树的带权路径长度: 霍 夫 曼 树: 由一结点到另一结点间的分支所构成 a→e的路径长度= 路径上的分支数目 2 从树根到每一结点的路径长度之和。 树长度= 10 结点到根的路径长度与结点上权的乘积 树中所有叶子结点的带权路径长度之和 带权路径长度最小的树。

  16. Weighted Path Length n WPL = wklk k=1 7 2 c a 5 4 2 4 7 5 b c d d b a 2 4 5 7 (a) b c d a (b) (c) Huffman树简介: 树的带权路径长度如何计算? 哈夫曼树则是:WPL 最小的树。 经典之例: Huffman树 WPL= 35 WPL=36 WPL=46

  17. 构造霍夫曼树的基本思想: 权值大的结点用短路径,权值小的结点用长路径。 构造Huffman树的步骤(即Huffman算法): (1)由给定的 n 个权值{w0, w1, w2, …, wn-1},构造具有 n 棵扩充二叉树的森林F = { T0, T1, T2, …, Tn-1 },其中每一棵扩充二叉树 Ti 只有一个带有权值 wi 的根结点,其左、右子树均为空。 (2)重复以下步骤, 直到 F 中仅剩下一棵树为止: ① 在 F 中选取两棵根结点的权值最小的扩充二叉树, 做为左、右子树构造一棵新的二叉树。置新的二叉树的根结点的权值为其左、右子树上根结点的权值之和。 ② 在 F 中删去这两棵二叉树。 ③ 把新的二叉树加入 F。 先举例!

  18. 例1:设有4个字符d,i,a,n,出现的频度分别为7,5,2, 4,怎样编码才能使它们组成的报文在网络中传得最快? 法1:等长编码。例如用二进制编码来实现。 取 d=00,i=01,a=10,n=11 法2:不等长编码,例如用哈夫曼编码来实现。 取 d=0; i=10, a=110, n=111 最快的编码是哪个? 是非等长的Huffman码! 怎样实现Huffman编码? 先要构造Huffman树!

  19. 构造Huffman树的步骤: 操作要点1:对权值的合并、删除与替换 ——在权值集合{7,5,2,4}中,总是合并当前值最小的两个权 注:方框表示外结点(叶子,字符对应的权值), 圆框表示内结点(合并后的权值)。

  20. 0 1 d 0 1 i 1 0 a n 操作要点2:按左0右1对Huffman树的所有分支编号! ——将 Huffman树 与 Huffman编码 挂钩 Huffman编码结果:d=0, i=10, a=110, n=111 WPL=1bit×7+2bit×5+3bit(2+4)=35 特点:每一码都不是另一码的前缀,绝不会错译! 称为前缀码

  21. 例2(严题集6.26③):假设用于通信的电文仅由8个字母 {a, b, c, d, e, f, g, h} 构成,它们在电文中出现的概率分别为{ 0.07, 0.19, 0.02, 0.06, 0.32, 0.03, 0.21, 0.10},试为这8个字母设计哈夫曼编码。如果用0~7的二进制编码方案又如何? 霍夫曼编码的基本思想是:概率大的字符用短码,概率小的用长码。由于霍夫曼树的WPL最小,说明编码所需要的比特数最少。这种编码已广泛应用于网络通信中。 解:先将概率放大100倍,以方便构造哈夫曼树。权值集合 w={7, 19, 2, 6, 32, 3, 21, 10}, 按哈夫曼树构造规则(合并、删除、替换),可得到哈夫曼树。

  22. × × × × 100 × × × × 60 × × 32 × × 40 × × 19 21 g e b 2 3 7 10 a d h f c 为清晰起见,重新排序为:w={2, 3, 6, 7, 10, 19, 21, 32} w1={5, 6, 7, 10, 19, 21, 32} w2={7, 10, 11, 19, 21, 32} w3={11, 17, 19, 21, 32} w4={19, 21, 28, 32} 28 w5={28,32,40} w6={40,60} 17 11 w7={100} 6 5 哈夫曼树

  23. 100 60 1 0 28 32 0 0 1 1 17 11 40 0 1 6 5 0 1 0 1 19 21 g e b 1 0 2 3 7 10 a d h f c 对应的哈夫曼编码(左0右1): Huffman码的WPL=2(0.19+0.32+0.21) + 4(0.07+0.06+0.10) +5(0.02+0.03) =1.44+0.92+0.25=2.61 WPL=3(0.19+0.32+0.21+0.07+0.06+0.10+0.02+0.03)=3 二进制码

  24. 另一种结果表示:

  25. 字符 空格 a b c d e f g h i 频度 186 64 13 22 32 103 21 15 47 57 字符 j k l m n o p q r s 频度 1 5 32 20 57 63 15 1 48 51 字符 t u v w y z x 频度 80 23 8 18 1 16 1 例3(实验二方案3):设字符集为26个英文字母,其出现频度如下表所示。 要求编程实现: 先建哈夫曼树,再利用此树对报文“This program is my favorite”进行编码和译码。 注:若圆满实现了此方案,平时成绩将以满分计。

  26. 提示1:霍夫曼树中各结点的结构可以定义为如下5个分量:提示1:霍夫曼树中各结点的结构可以定义为如下5个分量: 提示2:霍夫曼树的存储结构可采用顺序存储结构: 将整个霍夫曼树的结点存储在一个数组中:HT[1..n]; 将结点的编码存储在HC[1..n]中。 提示3:霍夫曼树如何构造?构造好之后又如何求得各结点对应的霍夫曼编码?——算法参见教材P147。 参考资料 实验二补充材料中的方案二程序; 喻信星空FTP网站上的“数据结构”演示程序

  27. 顺序结构 二叉链表 链式结构 二叉树 三叉链表 森林 先序遍历 中序遍历 后序遍历 先序线索树 中序线索树 后序线索树 霍夫曼树 二叉树小结 1、定义和性质 2、存储结构 3、遍历 4、线索化:线索树 霍夫曼编码

  28. 附:中序遍历迭代算法(利用堆栈) void iter_inorder(tree_pointer node) { int top= -1; /* initialize stack */ tree_pointer stack[MAX_STACK_SIZE]; for (;;) { for (; node; node=node->left_child) add(&top, node);/* add to stack */ node= delete(&top); /* delete from stack */ if (!node) break; /* empty stack */ printf(“%D”, node->data); node = node->right_child; } } 时间复杂度O(n)

  29. 附:层序遍历算法(利用队列) void level_order(tree_pointer ptr) /* level order tree traversal */ { int front = rear = 0; tree_pointer queue[MAX_QUEUE_SIZE]; if (!ptr) return; /* empty queue */ addq(front, &rear, ptr); for (;;) { ptr = deleteq(&front, rear); + * E * D / C A B

More Related