1、7 树7.1 树的概念【定义】 树(Tree)是 n(n0)个结点的有限集合 T,它满足如下两个条件:(1) 有且仅有一个特定的称为根(Root)的结点;(2) 其余的结点可分为 m(m0)个互不相交的有限集合,其中每一个集合又都是一颗树,并称为根的子树(Sub Tree) 。【基本术语】k1. 树的结点包含一个数据元素及若干指向其子树的分支。 结点拥有的子树数称为结点的度(degree) 。如图 7.1,A 的度为 3,C 的度为 1,F 的度为 0。2. 度为 0 的结点称为叶子(leaf)或终端结点。例如 K、L、F、G、M、I、J。度不为 0 的结点称为分支结点或非终端结点。除根结点外
2、,分支结点也称为内部结点。3. 树的度是树内各结点的度的最大值,如图 7.1 中树的度为 3。4. 结点的子树的根称为该结点的孩子(Child) ,该结点称为孩子的双亲(parent) 。如图 7.1.1,B 为 A 的子树的根,则 B 是 A 的孩子,而 A 则是 B 的双亲。同一个双亲的孩子之间互称为兄弟(sibling) ,例如 B、C、D 互为兄弟。将这些关系进一步推广,可认为 D 是 M 的祖父。结点的祖先是从根到该结点所经分支上的所有结点。例如,M 的祖先为 A、D、H。反之,结点的子树中的任一结点都称为该结点的子孙,如 B 的为 E、F、K、L。5. 结点的层次(level)是从
3、根开始定义起,根为第一层,根的孩子为第二层。若某结点在第 x 层,则其子树的根就在 x+1 层。树中结点的最大层次称为树的高度或深度(depth) 。如图 7.1 的树的深度为 4。6. 如果将树中的结点的各子树看成从左到右是有次序的(即不能互换) ,则称该树为有序树,否则称为无序树。如图 7.1.2。7. 森林(forest)是 m(m0)棵互不相交的树的集合。 A B C D E F G H I J K L M图 7.1.1 A A B C C B图 7.1.2 两棵不同的有序树7.2 二叉树7.2.1 二叉树的定义二叉树(binary tree)是一种树型结构,它的每个结点至多只有二棵子
4、树(即二叉树中不存在度大于 2 结点) ,并且,二叉树的子树有左右之分,其次序不能任意颠倒。(如图 7.2.1)满二叉树和完全二叉树是两种特殊形态的二叉树。满二叉树是指深度为 k,且有 2k-1 个结点的二叉树。完全二叉树是指深度为 k,有 n 个结点,当且仅当每一个结点都与深度为 k 的满二叉树中编号从 1 到 n 的结点一一对应时。7.2.2 二叉树的性质性质 1:在二叉树的第 i 层上至多有 个结点(i1) 。性质 2:深度为 k 的二叉树至多有 个结点(k1) 。性质 3:对任意一棵二叉树,如果度为 2 的结点数为 n2,则其叶子结点数为 。性质 4:具有 n 个结点的完全二叉树的深度
5、为 1log2性质 5:如果对一棵有 n 个结点的完全二叉树的结点按层序编号(每层从左到右) ,则对任一结点 i (1in) ,有: 如果 i=1,则结点 i 是二叉树的根;如果 i1,则其双亲结点是 i div 2 如果 2*in,则结点 i 无左孩子(结点 i 为叶子结点) ;否则其左孩子为 2*i 如果 2*i+1n,则结点 i 无右孩子,否则其右孩子为 2*i+1 参考答案及证明: 2 i-1证明:利用归纳法当 i=1 时,只有一个根结点,显然,2 i-1=20=1 正确;假设对所有的 j,1jnil then begin A B C D F G I M图 7.3.1【例 7.3_1】
6、DLR(先序):ABDICFMGLDR(中序):DIBAFMCGLRD(后序):IDBMFGCAwrite (p.data);preorder(p . lchild) ;preorder(p . rchild) ;end;end; 请完成中序遍历二叉树的递归算法:procedure inorder(p :pointer) ;beginend;请完成后序遍历二叉树的递归算法:procedure postorder(p :pointer) ;beginend;二叉树的三种遍历递归算法写得非常精妙,只要对它稍加修改(主要在 process 语句处) ,就可的各种不同功能、用途的算法。如建立二叉树、查
7、找结点、求每个结点所处的层次、求二叉树的高度、结点个数、复制二叉树等。7.4 二叉树的建立二叉树的建立可分先序、中序、后序三种方法。先序建立二叉树即输入结点数据的顺序按先序遍历所得的序列输入,输入“*” ,表示该子树为空,如输入 a b c * * d * * e * * ,得到的二叉树如图 7.4.1。中序、后序类推。 a b e c d图 7.4.1【练习】:请将前面遍历二叉树的算法稍加改动,分别写出先序、中序、后序建立二叉树的算法。7.5 树的存储结构【思考】 请先不要看下面内容,如果对一棵树(不定支数) ,你如何设计它的存储结构?一、多重链表表示法每个结点的设 m 个指针域指向该结点的
8、子数,m 为树的度,结点结构如下:很容易看出,多重链表的缺点是,当树中结点的子树数相差较大,许多结点的度小于 m 时,链表中有很多空指针域,空间较浪费。二、双亲表示法这种存储结构利用每个结点(除根外)只有唯一的双亲的性质,以一组连续空间存储树的结点,同时在每个结点中附设一个指示器指示其双亲结点在链表中的位置。data A B C D E F G H Iparent 0 1 1 2 2 3 5 5 51 2 3 4 5 6 7 8 9其存储结构说明如下:TYPE tnode=recordData:char;Parent:integer;end;VAR tree:array 1maxnode of
9、 tnode; 三、孩子表示法将每个结点的孩子结点用单链表链接起来,树中 n 个结点就有 n 条孩子链(叶子的孩子链为空) ,而将这 n 条链的头结点按顺序排列起来,组成一个线性表。 A B C D E F G H IData child1 child2 childmABCDEFGHI2 34 567 8 9123456789(a)孩子链表247 85369123456789ABCDEFGHI011223555(b)带双亲的孩子链表图 7.5.1如图 7.5.1(a)孩子链表的存储结构说明如下:TYPE tlink=tnode;Tnode=RECORDData : char;Next : tl
10、ink;End;Var tree: array 1n of tlink;这种方法较适用于涉及孩子的操作,但不适用于涉及双亲的操作。我们可以采取改进的存储方法,在每一个孩子链的头结点中加一个域,存储其双亲结点的位置,如图 7.5.1(b)。四、孩子兄弟表示法又称二叉链表表示法,链表中结点的两个链接域分别指向该结点的第一个孩子结点和下一个兄弟结点。结点结构说明如下:TYPE tlink=tnode;Tnode=RECORDData : char;fch , nsib :tlink;END7.6 森林与二叉树的转换从上面树的孩子兄弟表示法可以看出,二叉树和树都可用二叉链表作为存储结构,则以二叉链表作
11、为媒介可导出树与二叉树之间的一个对应关系。也就是说,给定一棵树,可以找出唯一的一棵二叉树与之对应。将一般树或森林转换成二叉树表示,其目的是为了节省存储空间。7.6.1 树或森林转换成二叉树2 37 8 9614 5树转换成二叉树的步骤如下: 将结点的所有兄弟连接在一起; 将所有不是连到最左子结点的子结点链表删除; 将结点的右子树向顺时针方向旋转 45。树转换成二叉树的步骤如下: 将森林中的各棵树分别转换成二叉树; 将所有转换而成的二叉树的树根相连;第二棵树作为第一棵树的右子树,第三棵树作为第二棵树的右子树,以第一棵树的树根为根。算法描述如下:如果 FT 1 , T2 , , Tm 是森林,则可
12、按如下规则转换成一棵二叉树 Broot , LB , RB。(1)若 F 为空,即 m0,则 B 为空树;(2)若 F 非空,即 m0,则 B 的根 root 即为森林中第一棵树的根 root(T1);B 的左子树 LB 是第一棵树转换而成的二叉树;B 的右子树 RB 是从森林 FT 2 , T3 , , Tm转换而成的二叉树。 转换所得的二叉树,左支是孩子,右支是兄弟。7.6.2 二叉树转换成森林或树二叉树转换成树其实是树转二叉树的逆过程,步骤如下: 将每个结点的右子树向逆时针方向旋转 45。【图 7.6.1】 A B C D E F G H I J(a) A B C D- - E F G
13、H I J(b) A B C D E F G H I J A B C D E F G H I J(c) (d) A B E C F G D H I J(e) 删除与左子树的横向连接; 断开连接后的结点与左子树为兄弟,将其与双亲相连。如果 Broot , LB , RB是一棵二叉树,则可按如下规则转换成森林 FT 1 , T2 , , Tm。(1)若 B 为空,则 F 为空;(2)若 B 非空,则 F 中第一棵树 T1的根 root(T 1) 即为二叉树 B 的根 root;T1中根结点的子树森林是由 B 的左子树 LB 转换而成的森林;F 中其余的树 FT 2 , T3 , , Tm 是由 B
14、 的右子树 RB 转换而成的森林。【练习】将下列的树或森林转换成二叉树(1)(2)【练习】将下列的二叉树转换成树或森林(1) (3)(2) (4) A B C D E F G H I A B C D E H F G I J K L M A B C D A B C D A B C D E A B C D(5)7.7 树和森林的遍历一、先序遍历森林若森林非空,可按以下规则遍历:(1)访问第一棵树的根;(2)先序遍历第一棵树的子树;(3)先序遍历余下的其它树;二、中序遍历森林若森林非空,可按以下规则遍历:(1)中序遍历森林中第一棵树的根结点(2)访问第一棵树的根结点;(3)中序遍历余下的其它树;7.
15、8 哈夫曼树及其应用7.8.1 扩充二叉树 几个基本概念从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径;路径上的分支数目称为路径长度;树的路径长度是从树根到每一结点的路径长度之和; 扩充二叉树是指将原二叉树中每个凡缺少左、右孩子的结点,均扩充为带左、右两个孩子。例如图 7.8.1(a)中的二叉树变为扩充二叉树后如图 7.8.1(b)所示,图中圆形结点是原来的,称为内部结点;方形结点是扩充结点,又称外部结点。 A B C D E F G H I J K L M N O(a)二叉树 (b) 扩充二叉树【图 7.8.1】 G H I J A B C D E F对上图森林进行遍历先序遍历
16、序列:A B C D E F G H I J中序遍历序列:B C D A F E H J I G内路径长度 I (从根到每一内结点的路径长度之和):I = 1 + 2 + 1 + 2 + 3 + 2 = 11外路径长度 E (从根到每一外结点的路径长度之和):E = 3 + 3 + 2 + 3 + 4 + 4 + 3 + 3 = 25 一些规律:(1) 若扩充二叉树有 n 个内部结点,则有 个外部结点;(2) 扩充二叉树的内、外路径长度 I、E 的关系是 E 。答案: (1)n+1 (2) E=I+2n证明:(1). n + 1 证明: 根据二叉树性质 3(对任意一棵二叉树,如果度为 2 的结
17、点数为 n2,则其叶子结点数为 n2+1)扩充二叉树的内部结点的度都是 2,有 n 个内部结点,则外部结点(即叶子)有 n+1 个。证毕。(2). E = I + 2n 证明: (数学归纳法)当 n=1 时,由于只有一个内部结点, I0,E2, 所以 EI2n 假设对于所有的 k,都有 E k = I k + 2 k当 k+1 时,即添加一个内部结点,设其路径长度为 L,则 I k+1 I k + L E k+1 E k L + 2 ( L + 1 ) E k + L + 2 ( I k + 2 k ) + L + 2 I k + L + 2 k + 2 I k+1 + 2 ( k+ 1) 证
18、毕。7.8.2 最优二叉树(哈夫曼树)对扩充二叉树的外部结点均赋于一个权值,则称带权二叉树。其带权路径长度是每个外部结点到根的路径长度 Lj 乘以权值 Wj 的积之和。 W1L1 W2L2 WmLm mjjE1(a) (b) (c)图 7. 8. 211 5 4 2452111154 2如图 7.8.2 中的几种扩充二叉树的带权路径长度分别为:WEa 112524222 44WEb 425311321 58WEc 111524323 39规律:权值越大的外部结点离根结点越近,其带权路径长度最短,如(c)中的树。假设有 n 个权值W 1 ,W2 , Wn, 试构造一棵有 n 个叶子结点的二叉树,
19、每个叶子结点(外部结点)带权 Wi ,则其中带权路径长度最小的二叉树称为最优二叉树或哈夫曼树。【例】将学生百分制成绩用 A、B、C、D、E 等级表示,成绩分别规律如下:分数 059 6069 7079 8089 90100等级 E D C B A比例数 0.05 0.15 0.40 0.30 0.10若有 10000 个数据,按图(a)的判定过程进行转换,则有 80%的数据至少要进行三次比较,完成 10000 个数据转换的比较次数为:10000(15% + 215% + 340% + 4(30%+10%) = 31500 次按图(b)的判定过程,完成 10000 个数据转换的比较次数为:100
20、00( 2(10% + 30% + 40%) + 3(5% + 15%) = 22000 次显然,后者的判定过程效率比前者高。图(b)所示的判定过程是最优的,该二叉树称为最优二叉树,又称哈夫曼树。7.8.3 哈夫曼树的构造a60a70a80a90ABCDEyyyy nnnna80a70 a90a60 ABCDEyyyynnnn(a) (b)如何构造哈夫曼树呢?哈夫曼(Huffman)最早给出一个带有一般规律的算法(哈夫曼算法):(1) 根据给定的 n 个权值 W1 ,W2 , Wn 构成 n 棵二叉树的集合 FT 1 ,T2 ,Tn,其中每棵二叉树 Ti 中只有一个带权为 Wi 的根结点,其左
21、右子树均空。(2) 在 F 中选取两棵根结点的权值最小的树作为左右子树构造一棵新的二叉树,且置新树的根结点的权值为其左右子树根结点的权值之和。(3) 在 F 中删除这两棵树,同时将新树加入 F 中。(4) 重复(2)和(3),直到 F 中只含一棵树为止。哈夫曼树的构建过程如图 7.8.3 所示。【图 7.8.3】7.8.4 哈夫曼树的应用1 用于判断过程利用哈夫曼树可以构成最佳判断过程。例如,要对一批正整数按下表要求分类:8 5 3 4(a)6 53 476(b)6 8(c)3 4765 611883 4715(d)5 6115 61183 471526(d)数 a 出现概率 属第几类a20
22、2/18 120a50 4/18 250a100 5/18 3100a 7/18 4其最佳判断过程如图 7.8.4(b)所示,这是按哈夫曼树的原则来组织的判断过程,其平均执行时间最短。而图 7.8.4(a)的判断平均时间最长。2 哈夫曼编码一般通信中传送字符采用等长的 ASCII 码。例如,假设需要传送的报文内容为“ABACCDA” ,它只有四种字符,只需两个字符的串就可分辩。设 A、B、C、D 的编码分别为:00、01、10、11,则上述报文的电文为“00010010101100” ,总长 14 位,对方接收时,可按 2位一分进行译码。如果对字符设计不等长的编码,且出现频率高的采用尽可能短的
23、编码,则可以提高通信速度。例如设计 A、B、C、D 的编码分别为:0、00、1、01,则上述电文可改为:“000011010” ,长度仅为 9。但这样的电文无法翻译,例如前四个字符“0000”就可有多种译法,或是“AAAA” ,或是“ABA” ,也可以是“BB” 。因此,要设计长短不等的编码,则要求任一字符的编码都不是另一个字符编码的前缀,这种编码称为前缀编码。可以利用二叉树来设计二进制的前缀编码。约定二叉树的左分支表示字符0 ,右分支表示字符1 ,树叶代表给定的字符,则可以从树根到叶子的路径上分支字符组成的字符串作为该叶子字符的编码。如图 7.8.5 所示。而哈夫曼树可使电文总长最短。以字符
24、出现的频率为权,设计一棵哈夫曼树,由此得到的二进制前缀编码称为哈夫曼编码。a20a50a100a 属第三类 a 属第四类a 属第二类a 属第一类a20a50a100a 属第四类a 属第三类a 属第二类 a 属第一类(a) (b)【图 7.8.4】D ECA B图 7.8.5000 01111下面讨论具体的做法:设需要编码的字符集 Dd 1,d2,dn,设 Wi 为 di 在文本中出现的次数,则权值WW 1,W2,Wn。将权值作为外部结点构造成哈夫曼树,取左支为 0,右支为 1,从根至叶路径上 0、1 组成的二进制串作为该叶结点字符的编码。将编码存入 D 对应的编码表。发送:根据字符从编码表中找
25、到相应的编码发送出去,如发送 abcbc 字符串,发出的二进制串是 111101100110。接收译码:对收到的二进制串,按顺序从哈夫曼树根走到叶结点,0 走左支,1 走右支,一直走到叶结点,就可译出一个字符。下次再从根开始对后续二进制位串进行译码,译出下一个字符,如此下去,直至译完为止。【练习】已知某系统在通信联络中只可能出现八种字符 a,b,c,d,e,f,g,h,其频率分别为:0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11,试设计哈夫曼编码,进行报文编码和译码。输入格式:输入文件名:hfm.in第 1 行为字母 B 或 Y,B 代表进行报文编码,Y 代表进
26、行译码。第 2 行为整数 n,代表报文/电文行数第 3 到 n3 行为报文/电文内容 输出格式:输出文件名:hfm.out第 1 行为报文/电文行数 n第 2 到 n+2 行为报文/电文内容 (若非报文字符则该行输出error )输入输出举例:输入:B2debbdhd输出:21111110101011110101111输入:Y1000101111输出:1fhd【综合练习】1、 中序遍历问题描述按先序输入一棵二叉树,请输出其中序遍历。(树结点用不同的小写字母表示, “*”表示子树为空) 。样例输入:abc*d*c*输出:cbdae2、 求先序排列(NOIP2001 普及组)问题描述给出一棵二叉树
27、的中序和后序排列,求出它的先序排列。(约定树结点用不同的大写字母表示,长度8) 。样例输入:BADC BDCA输出:ABCD3、有根树的同构(GDOI2003 day2-4)4、二叉树(GDKOI2005 day1-1)7.9 树与并查集7.8.1 引例【例】亲戚若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易,现在给出某个亲戚关系图,求任意给出的两个人是否具有亲戚关系。规定:x 和 y 是亲戚,y 和 z 是亲戚,那么 x 和 z 也是亲戚。如果 x,y 是亲戚,那么 x 的亲戚都是 y 的亲戚,y 的亲戚也都是 x 的亲戚。数据输入:第一行:三个整数 n,m,p, (n=500
28、0,m=5000,p=5000) ,分别表示有 n 个人,m 个亲戚关系,询问 p 对亲戚关系。以下 m 行:每行两个数 Mi,Mj,1=Mi,Mj=N,表示 Ai 和 Bi 具有亲戚关系。接下来 p 行:每行两个数 Pi,Pj,询问 Pi 和 Pj 是否具有亲戚关系。数据输出:P 行,每行一个Yes或No 。表示第 i 个询问的答案为“具有”或“不具有”亲戚关系。样例:abc deinput.txt6 5 31 21 53 45 21 31 42 35 6output.txtYesYesNo7.8.2 并查集并查集是一种树形数据结构,用于集合的合并和查找。并查集的主要操作有: 1)判断两个元
29、素是否属于同一个集合2)合并两个不相交集合3)路径压缩7.9.1 判断两个元素是否属于同一个集合;合并两个不相交集用 Si.father 表示元素 i 的父亲结点S1.father=1S2.father=1S3.father=1S4.father=3S5.father=3S6.father=512 34 56由此用某个元素所在树的根结点表示该元素所在的集合。判断两个元素时候属于同一个集合的时候,只需要判断他们所在树的根结点是否一样即可;也就是说,当我们合并两个集合的时候,只需要在两个根结点之间连边即可7.9.2 路径压缩如果我们每次判断两个元素是否属于同一个集合,都采用寻根判断的话,当树是链的
30、时候,需要 O(N)的时间,于是可以采用“路径压缩”的方法,提高效率。路径压缩是在找完根结点之后,在递归回来的时候顺便把路径上元素的父亲指针都指向根结点。之后,对任意两个元素是否属于同一个集合的判断,复杂度则降为 O(1)。参考程序:function getfather(v:integer):integer;beginif (fatherv=0) then getfather:=velse beginfatherv:=getfather(fatherv);getfather:=fatherv;end;end;function judge(x,y:integer):boolean;var fx,
31、fy : integer;beginfx := getfaher(x);fy := gefather(y);If fx=fy then judge := exit(true)else judge := false;fatherfx := fy;合并两个集合end;12 34 5612 3 4 5 6严歌苓说,人之间的关系不一定从陌生进展为熟识,从熟识走向陌生,同样是正常进展。人与人之间的缘分,远没有想像中的那么牢固,也许前一秒钟还牵手一起经历风雨,后一秒就说散就散,所以,你要懂得善待和珍惜。人与人相处,讲究个真心,你对我好,我就对你好,你给予真情,我还你真意,人心是相互的。两个人在一起,总会有
32、人主动,但主动久了,就会累,会伤心,心伤了就暖不回来了,凡事多站在对方的角度想一想,多一份忍耐和谦就,就不会有那么多的怨气和误解,也少了一些擦肩而过。做人不要太苛刻,太苛无友,人无完人,每个人都有这样或那样的缺点,重在包容。 包容是一种大度,整天笑呵呵的人并不是他没有脾气和烦恼,而是心胸开阔,两个懂得相互包容的人,才能走得越久。人与人相处,要多一份真诚,俗语说,你真我便真。常算计别人的人,总以为自己有多聪明,孰不知被欺骗过的人,就会选择不再相信,千万别拿人性来试人心,否则你会输得体无完肤。人与人相处不要太较真,生活中我们常常因为一句话而争辩的面红耳赤,你声音大,我比你嗓门还大,古人说,有理不在
33、声高,很多时候,让人臣服的不是靠嘴,而是靠真诚,无论是朋友亲人爱人都不要太较真了,好好说话,也是一种修养。俗语说,良言一句三冬暖, 你对我好,我又岂能不知,你谦让与我,我又怎能再得寸进尺,你欣赏我,我就有可能越变越好,你尊重我,我也会用尊重来回报你,你付出爱,必会得到更多的爱。与人相处,要多一份和善,切忌恶语相向,互相伤害就有可能永远失去彼此,每个人心中都有一座天平,每个人心中都藏一份柔软,表面再强势的人,内心也是渴求温暖的。做人要学会谦虚,虚怀若谷。人人都喜欢和谦虚的人交往,司马懿说:“臣一路走来,没有敌人,看见的都是朋友和师长”.这就是胸怀。有格局的人,心中藏有一片海,必能前路开阔,又何愁
34、无友。人与人相处,开始让人舒服的也许是你的言语和外表,但后来让人信服的一定是你的内在。就如那句,欣赏一个人,始于颜值,敬于才华,合于性格,久于善良,终于人品。人这一生,遇见相同的人不容易,遇见正确的人更不容易,只有选择了合适的相处方式,带上真诚与人相处,才会走得更长,更远更久。人与人相处,要多一份真诚,俗语说,你真我便真。常算计别人的人,总以为自己有多聪明,孰不知被欺骗过的人,就会选择不再相信,千万别拿人性来试人心,否则你会输得体无完肤。人与人相处不要太较真,生活中我们常常因为一句话而争辩的面红耳赤,你声音大,我比你嗓门还大,古人说,有理不在声高,很多时候,让人臣服的不是靠嘴,而是靠真诚,无论
35、是朋友亲人爱人都不要太较真了,好好说话,也是一种修养。俗语说,良言一句三冬暖, 你对我好,我又岂能不知,你谦让与我,我又怎能再得寸进尺,你欣赏我,我就有可能越变越好,你尊重我,我也会用尊重来回报你,你付出爱,必会得到更多的爱。与人相处,要多一份和善,切忌恶语相向,互相伤害就有可能永远失去彼此,每个人心中都有一座天平,每个人心中都藏一份柔软,表面再强势的人,内心也是渴求温暖的。做人要学会谦虚,虚怀若谷。人人都喜欢和谦虚的人交往,司马懿说:“臣一路走来,没有敌人,看见的都是朋友和师长”.这就是胸怀。有格局的人,心中藏有一片海,必能前路开阔,又何愁无友。人与人相处,开始让人舒服的也许是你的言语和外表,但后来让人信服的一定是你的内在。就如那句,欣赏一个人,始于颜值,敬于才华,合于性格,久于善良,终于人品。