1、公共基础知识第一章 数据结构与算法一、学习目标与要求1了解算法的基本概念和一些常用的算法,学会计算算法的时间复杂度;2掌握数据结构的基本概念,并了解数据的逻辑结构和存储结构,学会利用图形的方式表示数据结构;3了解线性表的基本概念,并掌握线性表的顺序存储结构以及顺序存储的线性表的基本运算;4了解栈和队列的基本概念,并掌握它们的基本运算;5了解线性链表的基本概念,并掌握线性链表的基本运算,同时,了解循环链表的基本概念和基本操作;6理解树的概念,尤其是二叉树的基本概念和相关性质,掌握二叉树的存储结构和遍历技术;7掌握查找技术,学会利用顺序查找和二分查找在数列中查找指定的数据;8学会利用相关的排序技术
2、实现无序数列的排序操作。二、内容要点(一)算法1算法的基本概念算法是指解题方案的准确而完整的描述。即是一组严谨地定义运算顺序的规则,并且每一个规则都是有效的,且是明确的,没有二义性,同时该规则将在有限次运算后可终止。1)算法的基本特征(1)可行性由于算法的设计是为了在某一个特定的计算工具上解决某一个实际的问题而设计的,因此,它总是受到计算工具的限制,使执行产生偏差。如:计算机的数值有效位是有限的,当大数和小数进行运算时,往往会因为有效位数的影响而使小数丢失,因此,在算法设计时,应该考虑到这一点。(2)确定性算法的设计必须是每一个步骤都有明确的定义,不允许有模糊的解释,也不能有多义性。例如,一个
3、实际的问题,小宝和萍萍共有 12 个苹果,小宝比萍萍多 4 个,请问小宝和萍萍各有几个苹果?这个问题,我们可以立一个方程 来求解,要求 x 和 y412yx的值,公式是正确的,但如何让计算能够进行计算,我们的算法不能把公式直接输进去,而应该设计出解题的步骤和过程。即设计的算法是计算工具所能够正常解决问题的过程。(3)有穷性算法的有穷性,即在一定的时间是能够完成的,即算法应该在计算有限个步骤后能够正常结束。例如,在数学中的无穷级数,在计算机中只能求有限项,即计算的过程是有穷的。(4)拥有足够的情报算法的执行与输入的数据和提供的初始条件相关,不同的输入或初始条件会有不同的输出结果,提供准确的初始条
4、件和数据,才能使算法正确执行。2)算法的基本要素一是数据对象的运算和操作,二是算法的控制结构。(1)算法中对数据的运算和操作算法实际上是按解题要求从环境能进行的所有操作中选择合适的操作所组成的一组指令序列。即算法是计算机所能够处理的操作所组成的指令序列。(2)算法的控制结构算法的功能不仅取决于所选用的操作,而且还与各操作之间的顺序有关。在算法中,操作的执行顺序又称算法的控制结构,一般的算法控制结构有三种:顺序结构、选择结构和循环结构。在算法描述是,有相关的工具对这三种结构进行描述,常用的描述工具有:流程图、N-S 结构图和算法描述语言等。3)算法设计的基本方法为用计算机解决实际问题而设计的算法
5、,即是计算机算法。通常的算法设计有如下几种:(1)列举法列举法的基本思想是,根据提出的问题,列举出所有可能的情况,并用问题中给定的条件检验哪些是满足条件的,哪些是不满足条件的。列举法通常用于解决“是否存在”或“有哪些可能”等问题。例如,我国古代的趣味数学题:“百钱买百鸡” 、 “鸡兔同笼”等,均可采用列举法进行解决。使用列举法时,要对问题进行详细的分析,将与问题有关的知识条理化、完备化、系统化,从中找出规律。(2)归纳法归纳法的基本思想是,通过列举少量的特殊情况,经过分析,最后找出一般的关系。归纳是一种抽象,即从特殊现象中找出一般规律。但由于在归纳法中不可能对所有的情况进行列举,因此,该方法得
6、到的结论只是一种猜测,还需要进行证明。(3)递推递推,即是从已知的初始条件出发,逐次推出所要求的各个中间环节和最后结果。其中初始条件或问题本身已经给定,或是通过对问题的分析与化简而确定。递推的本质也是一种归纳,递推关系式通常是归纳的结果。例如,裴波那契数列,是采用递推的方法解决问题的。(4)递归在解决一些复杂问题时,为了降低问题的复杂程序,通常是将问题逐层分解,最后归结为一些最简单的问题。这种将问题逐层分解的过程,并没有对问题进行求解,而只是当解决了最后的问题那些最简单的问题后,再沿着原来分解的逆过程逐步进行综合,这就是递归的方法。递归分为直接递归和间接递归两种方法。如果一个算法直接调用自己,
7、称为直接递归调用;如果一个算法 A 调用另一个算法 B,而算法 B 又调用算法 A,则此种递归称为间接递归调用。(5)减半递推技术减半递推即将问题的规模减半,然后,重复相同的递推操作。例如,一元二次方程的求解。(6)回溯法有些实际的问题很难归纳出一组简单的递推公式或直观的求解步骤,也不能使用无限的列举。对于这类问题,只能采用试探的方法,通过对问题的分析,找出解决问题的线索,然后沿着这个线索进行试探,如果试探成功,就得到问题的解,如果不成功,再逐步回退,换别的路线进行试探。这种方法,即称为回溯法。如人工智能中的机器人下棋。2算法复杂度算法的复杂度包括时间复杂度和空间复杂度。1)时间复杂度即实现该
8、算法需要的计算工作量。算法的工作量用算法所执行的基本运算次数来计算。同一个问题规模下,如果算法执行所需要的基本次数取决于某一特定输入时,可以用以下两种方法来分析算法的工作量:算法工作量=f(n)(1)平均性态用各种特定输入下的基本运算次数的加权平均值来度量算法的工作量。设 x 是某个可能输入中的某个特定输入,p(x)是 x 出现的概率,t(x)是算法在输入为x 时所执行的基本运算次数,则算法的平均性态定义为: nDxtpA)()(Dn表示当规模为 n 时,算法执行时所有可能输入的集合。(2)最坏情况复杂度指在规模为 n 时,算法所执行的基本运算的最大次数。它定义为: )(ma)(tWnDx例如
9、,在具有 n 个元素的数列中搜索一个数 x。平均性态: nqnqintpnAiii )1(2)()1()(11 即该数在数列中任何位置出现的数列是相同的,也有可能不存在,存在的概率为 q。如果有一半的机会存在,则概率 q 为 1/2,平均性态:n43)2()1(如果查找的元素一定在数列中,则每个数存在的概率即为 1,则平均性态为:2)(A最坏情况分析:即要查找的元素 X 在数列的最后或不在数列中,显然,它的最坏情况复杂度为: nitnWi 1|max2)算法的空间复杂度指要执行该算法所需要的内存空间。算法所占用的内存空间包括算法程序所占的空间、输入的初始数据所占的存储空间以及算法执行过程中所需
10、要的额外空间,如执行过程中工作单元以及某种数据结构所需要的附加存储空间等。(二)数据结构的基本概念1概念数据结构是指相互有关联的数据元素的集合。它包括以下两个方面: 表示数据元素的信息 表示各数据之间的前后件关系1)数据的逻辑结构是指反映数据元素之间的逻辑关系的数据结构。数据的逻辑结构有两个要素: 数据元素的集合,记作 D 数据之间的前后件关系,记作 R则数据结构 B=(D,R)2)数据的存储结构数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构,或数据的物理结构。即数据存储时,不仅要存放数据元素的信息,而且要存储数据元素之间的前后件关系的信息。通常的数据存储结构有顺序、链接、索引等
11、存储结构。2数据结构的图形表示数据结构的图形表示有两个元素: 中间标有元素值的方框表示数据元素,称为数据结点 用有向线段表示数据元素之间的前后件关系,即有向线段从前件结点指向后件结点注意:在结构图中,没有前件的结点称为根结点,没有后件的结点称为终端结点,也称叶子结点。3线性结构与非线性结构如果一个数据元素都没有,该数据结构称为空数据结构;在空数据结构中插入一个新的元素后数据结构变为非空数据结构;将数据结构中的所有元素均删除,则该数据结构变成空数据结构。如果一个非空的数据结构满足如下条件,则该数据结构为线性结构: 有且只有一个根结点 每一个结点最多只有一个前件,也最多只有一个后件线性结构又称线性
12、表。注意:在线性结构表中插入或删除元素,该线性表仍然应满足线性结构。如果一个数据结构不满足线性结构,则称为非线性结构。(三)线性表及其顺序存储结构1基本概念线性表是最常用的数据结构,它由一组数据元素组成。注意:这里的数据元素是一个广义的数据元素,并不仅仅是指一个数据。如,矩阵、学生记录表等。非空线性表的结构特征: 有且只有一个根结点,它无前件 有且只有一个终端结点,它无后件 除根结点和终端结点之外,所有的结点有且只有一个前件和一个后件。线性表中结点的个数称为结点的长度 n。当 n=0 时,称为空表。2顺序存储结构顺序存储结构的特点: 线性表中所有的元素所占的存储空间是连续的 线性表中各数据元素
13、在存储空间中是按逻辑顺序依次存放的通常,顺序存储结构中,线性表中每一个数据元素在计算机存储空间中的存储地址由该元素在线性表中的位置序号唯一确定。线性表的顺序存储结构下的基本运算: 在指定位置插入一个元素 删除线性表中的指定元素 查找某个或某些特定的元素 线性表的排序 按要求将一个线性表拆分为多个线性表 将多个线性表合并为一个线性表 复制线性表 逆转一个线性表3线性表的基本操作1)顺序表的插入运算在顺序存储结构的线性表中插入一个元素。注意:找到插入位置后,将插入位置开始的所有元素从最后一个元素开始顺序后移。另外,在定义线性表时,一定要定义足够的空间,否则,将不允许插入元素。2)顺序表的删除运算在
14、顺序在存储结构的线性表中删除一个元素。注意:找到删除的数据元素后,从该元素位置开始,将后面的元素一一向前移动,在移动完成后,线性表的长度减 1(四)栈和队列1栈及其基本运算1)栈栈是一种特殊的线性表,它是限定在一端进行插入和删除的线性表。它的插入和删除只能在表的一端进行,而另一端是封闭的,不允许进行插入和删除操作。在栈中,允许插入和删除操作一端称为栈顶,不允许插入和删除操作的一端则称为栈底。栈顶的元素总是最后被插入的元素,也是最先被删除的元素。它遵循的原则是:先进后出或后进先出。堆栈指针总是指向栈顶元素的。2)栈的顺序存储及其运算在栈的顺序存储空间 S(1:m)中,S(bottom)通常为栈底
15、元素,S(top)为栈顶元素。Top=0 表示栈空;top=m 表示栈满。1)入栈运算即在栈的顶部插入一个新元素。操作方式是:将栈顶指针加 1,再将元素插入至指针所指的位置。2)退栈运算退栈运算即将栈顶元素取出并赋给一个指定的变量。操作方式是:先将栈顶元素赋给指定的变量,再将栈顶指针减 1。3)读栈顶元素将栈顶元素赋给某一指定变量,但栈顶指针不变。2队列及其基本运算1)队列队列即是允许在一端进行插入,而在另一端进行删除的线性表。允许插入的一端称为队尾,通常用一个尾指针指向队尾;允许删除的一端称为队首,通常用一个队首指针指向排队元素的前一个位置。队列遵循的规则是:先进先出或后进后出2)循环队列及
16、其运算队列的顺序存储结构一般采用循环队列的形式。循环队列,即是次队列存储空间的最后一个位置绕到第一个位置,形成逻辑上的环状空间,供队列循环使用。在循环队列中,用队尾指针 rear 指向队列中的队尾元素,用排头指针 front 指向排头元素的前一个位置,因此,从排头指针 front 指向的后一个位置到队尾指针 rear 指向的位置之间所有的元素均为队列中的元素。循环队列的初始状态为空,即 rear=front=m。这里 m 即为队列的存储空间。循环队列的基本运算:入队运算和退队运算。入队运算:每进行一次入队运算,队尾指针加 1。当队尾指针 rear=m+1 时,即表示队列空间的尾部已经放置了元素
17、,则下一个元素应该旋转到队列空间的首部,即 rear=1退队运算:每退队一个元素,排头指针加 1。当排头指针 front=m+1 时,即排头指针指向队列空间的尾部,退队后,排头指针指向队列空间的开始,即 front=1。在队列操作时,循环队列满时,front=rear,队列空时,也有 rear=front,即在队列空或满时,排头指针和队尾指针均指向同一个位置。要判断队列空或满时,还应增加一个标志,s 值的定义: 表 示 队 列 满表 示 队 列 空10s判断队列空与队列满的条件下:队列空的条件:s=0队列满的条件:s=1、front=rear(1)入队运算即在队尾加入一个新元素。这个运算有两个
18、基本操作:首先,将队尾指针加 1,即rear=rear+1,当 rear=m+1 时,置 rear=1,然后,将新元素插入到队尾指针指向的位置。当循环队列非空(s=1) ,且 front=rear 时,队列满,不能进行入队操作。此情况称“上溢” 。(2)退队操作即将队首的元素赋给一个指定的变量。该运算也有两个基本操作:首先,将排头指针加 1,即 front=front+1,当 front=m+1 时,置 front=1,然后,将排头指针指向的元素赋给指定的变量。当循环队列为空(s=0)时,不能进行退队运算。此种情况称为“下溢” 。(五)线性链表1基本概念前面的线性表均是采用顺序存储结构及在顺序
19、存储结构下的运算。1)顺序存储的优点: 结构简单 运算方便2)顺序存储结构的缺点: 要在顺序存储的线性表中插入一个新元素或删除一个元素时,为了保证插入或删除后的线性表仍然为顺序存储。在插入或删除元素时,需要移动大量的数据元素,因此运算效率较低。 如果一个线性表分配顺序存储空间后,如果出现线性表的存储空间已满,但还需要插入元素时,会发生“上溢”错误。 在实际应用时,可能有多个线性表同时使用存储空间,这样给存储空间的分配带来问题,有可能使有的队列空间不够或过多造成浪费。基于上述情况,对于大的线性表或元素变动频繁的大线性表不宜采用顺序存储结构,而应采用链式存储结构。3)链式存储结构假设每一个数据结点
20、对应一个存储单元,该存储单元称为存储结点,简称结点。在链式存储方式中,要求每一个结点由两部分组成:一部分用于存放数据元素,你为数据域;另一部分用于存放指针,称为指针域。该指针用于指向该结点的前一个或后一个结点。在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系不一致,而数据元素之间的逻辑关系是由指针域来确定的。链式存储结构既可以用于线性结构,也可用于非线性结构。4)线性链表线性表的链式存储结构称为线性链表。将存储空间划分成若干的小块,每块占用若干个字节,这些小块称为存储结点。将存储结点分为两个部分,一部分用于存储数据元素的值,称为数据域;另一部分用
21、于存储元素之间的前后件关系,即存放下一个元素在存储序号(即存储地址) ,即指向后件结点,称为指针域。在线性链表中用一个专门的指针 HEAD 指向线性链表中第一个数据元素的结点(即存放第一个元素的地址) 。线性表中最后一个元素没有后件,因此,线性链表中的最后一个结点的指针域为空(用 Null 或 0 表示) ,表示链终结。在线性链表中,各元素的存储序号是不连续的,元素间的前后件关系与位置关系也是不一致的。在线性链表中,前后件的关系依靠各结点的指针来指示,指向表的第一个元素的指针 HEAD 称为头指针,当 HEAD=NULL 时,表示该链表为空。对于线性链表,可以从头指针开始,沿着各结点的指针扫描
22、到链表中的所有结点。这种线性链表称为线性单链表,即可以从表头开始向后扫描链表中的所有结点,而不能从中间或表尾结点向前扫描位于该结点之前的元素。这种链表结构的缺点是不能任意地对链表中的元素按下同的方向进行扫描。在某些应用时,如果对链表中的元素设置两个指针域,一个为指向前件的指针域,称为左指针(LLink) ,一个为指向后件的指针域,称为右指针(RLink) 。则这种链表是双向链表。5)带链的栈带链的栈即是用来收集计算机存储空间中的所有空闲的存储结点,这种带链的栈称为可利用栈。当需要存储结点时,即从可利用的栈的顶部取出栈顶结点;当系统要释放一个存储结点时,将该结点空间放回到可利用栈的栈顶。即在计算
23、机中所有空闲的空间,均可以以结点的方式链接到可利用栈中,随着其他线性链表中结点的插入与删除,可利用栈处于动态变化之中,即可利用栈经常要进行退栈和入栈操作。6)带链的队列队列也是线性表,也可利用链式存储结构来进行保存。2线性链表的基本运算线性链表包括的基本运算: 在链表中包含指定元素的结点之前插入一个新元素 在链表中删除包含指定元素的结点 将两个线性链表按要求合并成一个线性链表 将一个线性链表按要求进行分解 逆转线性链表 复制线性链表 线性链表的排序 线性链表的查找1)线性链表中查找指定的元素在线性链表中查找元素 X:从头指针指向的结点开始往后沿指针进行扫描,直到后面已没有结点或下一个结点的数据
24、域为 X 为止。元素的查找,经常是为了进行插入或删除操作而进行的,因此,在查找时,往往是需要记录下该结点的前一个结点。2)线性链表的插入线性链表的插入即在链式存储结构的线性表中插入一个新元素。在线性链表中包含元素 x 的结点之前插入新元素 b,插入过程:(1)从可利用栈中取得一个结点,设该结点号为 p,即取得的结点的存储序号存放在变量 p 中。并置结点 p 的数据域为插入的元素值 b。(2)在线性链表中寻找包含元素 x 的前一个结点,该结点的存储序号为 q。(3)将结点 p 插入到结点 q 之后。具体的操作:首先,使结点 p 插入到结点 q 之后(即结点 q 的后件结点) ,然后,使结点 q
25、的指针域 内容改为指向结点 p。线性链表的插入操作,新结点是为来自于可利用栈,因此不会造成线性表的溢出。同样,由于可利用栈可被多个线性表利用,因此,不会造成存储空间的浪费,大家动态地共同使用存储空间。3)线性链表的删除线性链表的删除,即是在链式存储结构下的线性表中删除指定元素的结点。操作方式:(1)在线性表中找到包含指定元素 x 的前一个结点 p(2)将该结点 p 后的包含元素 x 的结点从线性链表中删除,然后将被删除结点的后一个结点 q 的地址提供给结点 p 的指针域,即将结点 p 指向结点 q。(3)将删除的结点送回可利用栈。从以上的删除操作可见,删除一个指定的元素,不需要移动其他的元素即
26、可实现,这是顺序存储的线性表所不能实现的。同时,此操作还可更有效地利用计算机的存储空间。3循环链表及其基本操作在线性链表中,虽然对数据元素的插入和删除操作比较简单,但由于它对第一个结点和空表需要单独处理,使得空表与非空表的处理不一致。循环链表,即是采用另一种链接方式,它的特点如下:(1)在循环链表中增加一个表头结点,其数据域为任意或根据需要来设置,指针域指向线性表的第一个元素的结点。循环链表的头指针指向表头结点。(2)循环链表中最后一个结点的指针域不是空的,而是指向表头结点。在循环链表中,所有结点的指针构成一个环状链。在循环链表中,只要指出表中任何一个结点的位置,均可以从它开始扫描到所有的结点
27、,而线性链表做不到,线性链表是一种单向的链表,只能按照指针的方向进行扫描。循环链表中设置了一个表头结点,因此,在任何时候都至少有一个结点,因此空表与非空表的运算相统一。(六)树与二叉树1树的基本概念树是一种简单的非线性结构。在树结构中,数据元素之间有着明显的层次结构。在树的图形表示中,用直线连接两端的结点,上端点为前件,下端点为后件。AB C DE F G H IJ K LM N在树结构中,每一个结点只有一个前件,称为父结点。如 A 即为结点 B、C、D 的父结点。没有父结点的结点只有一个,称为根结点。如上图所示,结点 A 即为根结点。每一个结点可以有多个后件,它们均称为该结点的子结点。如结点
28、 G、H、I 是结点 D的子结点。没有后件的结点,称为叶子结点。上图中,叶子结点有:J、M、N、L、C、G、H、I。在树结构中,一个结点所拥有的后件结点个数称为该结点的度。例如,结点 D 的度为3,结点 E 的度为 1 等,按此原则,所有叶子结点的度均为 0。在树中,所有结点中最大的度称为该树的度。上图所示的树中,所有结点中最大的度是 3,所以该树的度为 3。树分层,根结点为第一层,往下依次类推。同一层结点的所有子结点均在下一层。如上图:A 结点在第 1 层,B、C、D 结点在第 2 层;E、F、G、H、I 在第 3 层;J、K、L 在第4 层;M、N 在第 5 层。树的最大层次称为树的深度。
29、上图树的深度为 5。在树中,某结点的一个子结点为根构成的树称作该结点的子树。叶子结点没有子树。在计算机中,可以用树来表示算术表达式。原则如下:(1)表达式中每一个运算符在树中对应一个结点,称为运算符结点(2)运算符的每一个运算对象在树中为该运算符结点的子树(在树中的顺序为从左到右)(3)运算对象中的单变量均为叶子结点树在计算机中用多重链表表示。多重链表中的每个结点描述了树中对应结点的信息,而每个结点中的链域(即指针域)个数将随着树中该结点的度而定义。如果在树中,每一个结点的子结点的个数不相同,因此在多重链中各结点的链域个数也不相同,会导致算法太复杂。因此,在树中,常采用定长结点来表示树中的每一
30、个结点,即取树的度作为每个结点的链域的个数。这样,管理相对简化了,但会造成空间的浪费,因为有许多的结点存在空链域。2二叉树及其基本性质1)二叉树的定义二叉树的特点: 非空二叉树只有一个根结点 每一个结点最多只有两个子结点,且结点分左右。则一个结点最多可以有两棵子树,分别称为左子树和右子树在二叉树中,每一个结点的度最大为 2,即二叉树的度为 2。在二叉树中,任何的子树也均为二叉树。在二叉树中,每一个结点的子树被分为左子树和右子树。在二叉树中,允许某一个结点只有左子树或只有右子树。如果一个结点既没有左子树,也没有右子树,则该结点为叶子结点。2)二叉树的性质性质 1:在二叉树的第 k 层上,最多有
31、2k-1(k1)个结点。性质 2:深度为 m 的二叉树最多有 2m-1 个结点。性质 3:在任意一棵二叉树中,度为 0 的结点(即叶子结点)总比度为 2 的结点多一个。性质 4:具有 n 个结点的二叉树,其深度至少为log 2n+1,其中log 2n表示 log2n 的整数部分。3)满二叉树与完全二叉树(1)满二叉树满二叉树的特点:除最后一层外,每一层上的所有结点都有两个子结点。即在满二叉树中,每一层上的结点数都达到最大值,即在满二叉树上的第 k 层上有 2k-1个结点。如下即为一棵满二叉树。(2)完全二叉树特点:除最后一层外,每一层上的结点数均达到最大值,在最后一层上只缺少右边的若干个结点。
32、即如果从根结点开始,对二叉树的结点自上而下、自左而右用自然数进行连续编号,则深度为 m、且有 n 个结点的二叉树,当且仅当其每一个结点都与深度为 m 的满二叉树中编号从 1 到 n 的结点一一对应,则是完全二叉树。对于完全二叉树,叶子结点只能在层次最大的两层中出现;对于任何一个结点,若其右分支下的子树结点的最大层次为 p,则其分支下的子孙结点的最大层次为 p 或 p+1。完全二叉树具有的性质:性质 5:具有 n 个结点的完全二叉树的深度为log 2n+1性质 6:设完全二叉树共有 n 个结点。如果从根结点开始,按层次(每一层从左到右)用自然数 1、2、n 给结点编号,对于编号为 k(k=1,2
33、,n)的结点有如下结论: 若 k=1,则该结点为根结点,它没有父结点;若 k1,则该结点的父结点编号为INT(k/2)。 若 2kn,则编号为 k 的结点的左子结点编号为 2k;否则该结点无左子结点(当然也没有右子结点)AB CD E F GH I J K L M N O满二叉树AB CD E F GH I J K L M N OP Q R完全二叉树 若 2k+1n,则编号为 k 的结点的右子结点编号为 2k+1;否则该结点无右子结点。3二叉树的存储结构二叉树的存储常采用链式存储结构。存储二叉树中各元素的存储结点由两个部分组成:数据域和指针域。在二叉树中,由于每个结点可有两个子结点,则它的指针
34、域有两个:一个用于存储该结点的左子结点的存储地址,即称为左指针域;一个用于存储指向该结点的右子结点的存储地址,称为右指针域。存储结构如下:Lchild Value Rchildi L(i) V(i) R(i)即二叉树的存储结构中每一个存储结点都有两个指针域,因此,二叉树的链式存储结构也称为二叉树的链表。在二叉树在存储中,用一个头指针指向二叉树的根结点的存储地址。如图所示的二叉树:如果我们将该二叉树的所有结点顺序编号,顺序存放在存储空间里,则它们在内存空间中的存放方式是:i L(i) V(i) R(i)BT 1 2 A 32 4 B 53 6 C 74 8 D 95 10 E 116 12 F
35、137 14 G 158 16 H 179 18 I 010 0 J 011 0 K 012 0 L 013 0 M 014 0 N 015 0 O 0AB CD E F GH I J K L M N OP Q R16 0 P 017 0 Q 018 0 R 0当然,对于满二叉树或完全二叉树而言,也可采用顺序存储的方式,但顺序存储的方式不适合其他的二叉树。4二叉树的遍历二叉树的遍历即是不重复地访问二叉树的所有结点。在遍历二叉树时,一般先遍历左子树,然后再遍历右子树。在先左后右的原则下,二叉树的遍历又可分为三种:前序遍历、中序遍历和后序遍历。1)前序遍历前序遍历即先访问根结点,然后遍历左子树,最
36、后遍历右子树。在遍历左子树和遍历右子树时,依然是先遍历根结点,然后是左子树,再是右子树。操作的具体方式: 若二叉树为空,则结束返回。 否则:访问根结点前序遍历左子树前序遍历右子树如上图所示的完全二叉树,它的前序遍历结果是:A、B、D、H、P、Q、I、R、E、J、K、C、F、L、M、G、N、O2)中序遍历中序遍历,即先遍历左子树,然后访问根结点,最后是遍历右子树。具体的操作方式: 若二叉树为空,则结束返回。 否则:中序遍历左子树访问根结点 中序遍历右子树这里强调,在遍历左子树和右子树时,仍然要采用中序遍历的方法。如上图所示的完全二叉树,它的中序遍历结果是:P、H、Q、D、R、I、B、J、E、K、
37、A、L、F、M、C、N、G、O3)后序遍历后序遍历,即选遍历左子树,然后是遍历右子树,最后访问根结点。具体的操作方式: 若二叉树为空,则结束返回。 否则:前序遍历左子树前序遍历右子树访问根结点如上图所示的完全二叉树,它的后序遍历结果是:P、Q、H、R、I、D、J、K、E、B、L、M、F、N、O、G、C、A(七)查找技术查找即是指在一个给定的数据结构中查找某个指定的元素。1顺序查找顺序查找又称顺序搜索。一般是在线性表中查找指定的元素。基本操作方法是:从线性表的第一个元素开始,与被查元素进行比较,相等则查找成功,否则继续向后查找。如果所有的元素均查找完毕后都不相等,则该元素在指定的线性表中不存在。
38、顺序查找的最好情况:要查找的元素在线性表的第一个元素,则查找效率最高;如果要查找的元素在线性表的最后或根本不存在,则查找需要搜索所有的线性表元素,这种情况是最差情况。对于线性表而言,顺序查找效率很低。但对于以下的线性表,也只能采用顺序查找的方法: 线性表为无序表,即表中的元素没有排列不是按大小顺序进行排列的,这类线性表不管它的存储方式是顺序存储还是链式存储,都只能按顺序查找方式进行查找 即使是有序线性表,如果采用链式存储,也只能采用顺序查找方式例如,现有线性表:7、2、1、5、9、4,要在序列中查找元素 6,查找的过程是: 整个线性表的长度为 5 查找计次 n=1,将元素 6 与序列的第一个
39、7 元素进行比较,不等,继续查找 n=2,将 6 与第二个元素 2 进行比较,不等,继续 n=3,将 6 与第三个元素 1 进行比较,不等,继续 n=4,将 6 与第四个元素 5 进行比较,不等,继续 n=5,将 6 与第五个元素 9 进行比较,不等,继续 n=6,将 6 与第六个元素 4 进行比较,不等,继续 n=7,超出线性表的长度,查找结束,则该表中不存在要查找的元素。2二分查找二分查找只适用于顺序存储的有序表。此处所述的有序表是指线性中的元素按值非递减排列(即由小到大,但允许相邻元素值相等) 。二分查找的方法如下:将要查找的元素与有序序列的中间元素进行比较: 如果该元素比中间元素大,则
40、继续在线性表的后半部分(中间项以后的部分)进行查找 如果要查找的元素的值比中间元素的值小,则继续在线性表的前半部分(中间项以前的部分)进行查找这个查找过程一直按相同的顺序进行下去,一直到查找成功或子表长度为 0(说明线性表中没有要查找的元素)有序线性表的二分法查找,条件是必须这个有序线性表的存储方式是顺序存储的。它的查找效率比顺序查找要高得多,它的最坏情况的查找次数是 log2n 次,而顺序查找的最坏情况的查找次数是 n 次。当然,二分查找的方法也支持顺序存储的递减序列的线性表。有非递减有序线性表:1、2、4、5、7、9,要查找元素 6。查找的方法是: 序列长度为 n=6,中间元素的序号 m=
41、(n+1)/2=3 查找计次 k=1,将元素 6 与中间元素即元素 4 进行比较,不等,64 查找计次 k=2,查找继续在后半部分进行,后半部分子表的长度为 3,计算中间元素的序号:m=3+(3+1)/2=5,将元素与后半部分的中间项进行比较,即第 5 个元素中的 7 进行比较,不等,67 查找计次 k=3,继续查找在后半部分序列的前半部分子序列中查找,子表长度为1,则中间项序号即为 m=3+(1+1)/2=4,即与第 4 个元素 5 进行比较,不相等,继续查找的子表长度为 0,则查找结束(八)排序技术排序即是将一个无序的序列整理成按值非递减顺序排列的有序序列。在这里,我们讨论的是顺序存储的线
42、性表的排序操作。1交换类排序法交换类排序法,即是借助于数据元素之间的互相交换进行排序的方法。1)冒泡排序法冒泡排序法即是利用相邻数据元素之间的交换逐步将线性表变成有序序列的操作方法。操作过程如下: 从表头开始扫描线性表,在扫描过程中逐次比较相邻两个元素的大小,若相邻两个元素中前一个元素的值比后一个元素的值大,将两个元素位置进行交换,当扫描完成一遍时,则序列中最大的元素被放置到序列的最后。 再继续对序列从头进行扫描,这一次扫描的长度是序列长度减 1,因为最大的元素已经就位了,采用与前相同的方法,两两之间进行比较,将次大数移到子序列的末尾。 按相同的方法继续扫描,每次扫描的子序列的长度均比上一次减
43、 1,直至子序列的长度为 1 时,排序结束。例如,有序列 5、2、9、4、1、7、6,将该序列从小到大进行排列。采用冒泡排序法,具体操作步骤如下:序列长度 n=7原序列 5 2 9 4 1 7 6第一遍(从前往后) 5 2 9 4 1 7 62 5 9 4 1 7 62 5 4 9 1 7 62 3 4 1 9 7 62 5 4 1 7 9 6第一遍结束后 2 5 4 1 7 6 9第二遍(从前往后) 2 5 4 1 7 6 92 4 5 1 7 6 92 4 1 5 7 6 92 4 1 5 6 7 9第二遍结束后 2 4 1 5 6 7 9第三遍(从前往后) 2 4 1 5 6 7 92
44、1 4 5 6 7 9第三遍结束 2 1 4 5 6 7 9第四遍(从前往后) 2 1 4 5 6 7 91 2 4 5 6 7 9第四遍结束 1 2 4 5 6 7 9最后结果 1 2 4 5 6 7 9扫描的次数,最多需要扫描 n-1 次,如果序列已经就位,则扫描结束。测试是否已经就位,可设置一个标志,如果该次扫描没有数据交换,则说明数据排序结束。2)快速排序法冒泡排序方法每次交换只能改变相邻两个元素之间的逆序,速度相对较慢。如果将两个不相邻的元素之间进行交换,可以消除多个逆序。快速排序的方法是:从线性表中选取一个元素,设为 T,将线性表后面小于 T 的元素移到前面,而前面大于 T 的元素
45、移到后面,结果将线性表分成两个部分(称为两个子表) ,T 插入到其分界线的位置处,这个过程称为线性表的分割。对过对线性表的一次分割,就以 T 为分界线,将线性表分成前后两个子表,且前面子表中的所有元素均不大于 T,而后面的所有元素均不小于 T。再将前后两个子表再进行相同的快速排序,将子表再进行分割,直到所有的子表均为空,则完成快速排序操作。在快速排序过程中,随着对各子表不断的进行分割,划分出的子表会越来越多,但一次又只能对一个子表进行分割处理,需要将暂时不用的子表记忆起来,这里可用栈来实现。对某个子表进行分割后,可以将分割出的后一个子表的第一个元素与最后一个元素的位置压入栈中,而继续对前一个子
46、表进行再分割;当分割出的子表为空时,可以从栈中退出一个子表进行分割。这个过程直到栈为空为止,说明所有子表为空,没有子表再需分割,排序就完成。2插入类排序法1)简单插入排序插入排序,是指将无序序列中的各元素依次插入到已经有序的线性表中。插入排序操作的思路:在线性表中,只包含第 1 个元素的子表,作为该有序表。从线性表的第 2 个元素开始直到最后一个元素,逐次将其中的每一个元素插入到前面的有序的子表中。该方法与冒泡排序方法的效率相同,最坏的情况下需要 n(n-1)/2 次比较。例如,有序列 5、2、9、4、1、7、6,将该序列从小到大进行排列。采用简单插入排序法,具体操作步骤如下:序列长度 n=7
47、5 2 9 4 1 7 6j=22 5 9 4 1 7 6j=32 5 9 4 1 7 6j=42 4 5 9 1 7 6j=51 2 4 5 9 7 6j=61 2 4 5 7 9 6j=7插入排序后的结果 1 2 4 5 6 7 92)希尔排序法希尔排序法的基本思想:将整个无序序列分割成若干小的子序列分别进行插入排序。子序列的分割方法:将相隔某个增量 h 的元素构成一个子序列,在排序的过程中,逐次减小这个增量,最后当 h 减小到 1 时,再进行一次插入排序操作,即完成排序。增量序列一般取 ht=n/2k(k=1,2,log2n),其中 n 为待排序序列的长度。3选择类排序法1)简单选择排序
48、法基本思路:扫描整个线性表,从中选出最小的元素,将它交换到表的最前面,然后对后面的子表采用相同的方法,直到子表为空为止。对于长度为 n 的序列,需要扫描 n-1 次,每一次扫描均找出剩余的子表中最小的元素,然后将该最小元素与子表的第一个元素进行交换。例如,有序列 5、2、9、4、1、7、6,将该序列从小到大进行排列。采用简单选择排序法,具体操作步骤如下:原序列 5 2 9 4 1 7 6第一遍扫描 1 2 9 4 5 7 6第二遍扫描 1 2 9 4 5 7 6第三遍扫描 1 2 4 9 5 7 6第四遍扫描 1 2 4 5 9 7 6第五遍扫描 1 2 4 5 6 7 9第六遍扫描 1 2
49、4 5 6 7 9排序结果 1 2 4 5 6 7 92)堆排序法堆排序法属于选择类排序方法。堆的定义:具有 n 个元素的序列(h 1,h2,hn) ,当且仅当满足(I=1,2,n/2)时称之为堆。1212iiiih或本节只讨论满足前者条件的堆。由堆的定义看,堆顶元素(即第一个元素)必为最大项。可以用一维数组或完全二叉树来表示堆的结构。用完全二叉树表示堆时,树中所有非叶子结点值均不小于其左右子树的根结点的值,因此堆顶(完全二叉树的根结点)元素必须为序列的 n 个元素中的最大项。例如,有序列 5、2、9、4、1、7、6,将该序列从小到大进行排列。利用堆排序法将该序列进行排序。操作方式即:先将无序堆的根结点 5 与左右子树的根结点 2、9 进行比较,59,将 5与 9 进行交换;整后,对左右子树进行堆调整,左子树的根结点 2 小于其左叶子结点 5,调整;右子树的根结点 5 小于其左右子结点 7 和