1、数据结构课程的内容,10.1 概述 10.2 插入排序 10.3 交换排序 10.4 选择排序 10.5 归并排序 10.6 基数排序,第10章 内部排序,10.1 概述,1. 什么是排序?将一组杂乱无章的数据按一定的规律顺次排列起来。,2. 排序的目的是什么?,存放在数据表中,按关键字排序,便于查找!,10.1 概述,3.排序算法的好坏如何衡量? 时间效率 排序速度(即排序所花费的全部比较次数) 空间效率 占内存辅助空间的大小若排序算法所需的辅助空间不依赖问题的规模n,即空间复杂度是O(1) ,则称排序方法是就地排序,否 则是非就地排序。 稳 定 性 若两个记录A和B的关键字值相等,但排序后
2、A、B的先后次序保持不变,则称这种排序算法是稳定的。,4. 什么叫内部排序?什么叫外部排序?, 若待排序记录都在内存中,称为内部排序;内部排序基本操作有两种: 比较两个关键字的大小;(比不可少的操作) 存储位置的移动。 若待排序记录一部分在内存,一部分在外存,则称为外部排序。,注:外部排序时,要将数据分批调入内存来排序,中间结果还要及时放入外存,显然外部排序要复杂得多。,5.待排序记录在内存中怎样存储和处理?,处理方式: 顺序排序 数据间的逻辑顺序关系通过其物理存储位置的相邻来体现,排序时直接移动记录;适合数据较少的情况! 链表排序 数据间的逻辑顺序关系通过结点中的指针体现,排序时只修改指针,
3、不移动数据; 地址排序 数据存储在一段连续地址的空间,构造一个辅助表保持各数据的存放地址(指针),排序时先修改辅助表中的地址,最后再移动记录。 适合数据较多的情况!,注:大多数排序算法都是针对顺序表结构的(便于直接移动元素),6. 顺序存储(顺序表)的抽象数据类型如何表示?,Typedef struct /定义每个记录(数据元素)的结构KeyType key ; /关键字 InfoType otherinfo; /其它数据项 RecordType ;,Typedef struct /定义顺序表的结构RecordType r MAXSIZE +1 ; /存储顺序表的向量/r0一般作哨兵或缓冲区i
4、nt length ; /顺序表的长度 SqList ;,# define MAXSIZE 20 /设记录不超过20个 typedef int KeyType ; /设关键字为整型量(int型),7. 内部排序的算法有哪些?,按排序的规则不同,可分为5类: 插入排序 交换排序(重点是快速排序) 选择排序 归并排序 基数排序,d关键字的位数(长度),按排序算法的时间复杂度不同,可分为3类: 简单的排序算法:时间效率低,O(n2) 先进的排序算法: 时间效率高,O( nlog2n ) 基数排序算法:时间效率高,O( dn),10.2 插入排序,插入排序的基本思想是:,插入排序有多种具体实现算法:1
5、) 直接插入排序2) 折半插入排序3) 2路插入排序4) 希尔排序,每步将一个待排序的对象,按其关键码大小,插入到前面已经排好序的一组对象的适当位置上,直到对象全部插入为止。,简言之,边插入边排序,保证子序列中随时都是排好序的。,1) 直接插入排序,新元素插入到哪里?,例1:关键字序列T=(13,6,3,31,9,27,5,11),请写出直接插入排序的中间过程序列。,【13】, 6, 3, 31, 9, 27, 5, 11 【6, 13】, 3, 31, 9, 27, 5, 11 【3, 6, 13】, 31, 9, 27, 5, 11 【3, 6, 13,31】, 9, 27, 5, 11
6、【3, 6, 9, 13,31】, 27, 5, 11 【3, 6, 9, 13,27, 31】, 5, 11 【3, 5, 6, 9, 13,27, 31】, 11 【3, 5, 6, 9, 11,13,27, 31】,在已形成的有序表中线性查找,并在适当位置插入,把原来位置上的元素向后顺移。,最简单的排序法!,例2:关键字序列T= (21,25,49,25*,16,08), 请写出直接插入排序的具体实现过程。,*表示后一个25,i=1,21,i=2,i=3,i=5,i=4,i=6,25,25,25,49,49,49,25*,49,16,16,08,49,解:假设该序列已存入一维数组V7中,
7、将V0作为缓冲或暂存单元(Temp)。则程序执行过程为:,初态:,16,25,21,16,完成!,时间效率: O(n2)因为在最坏情况下,所有元素的比较次数总和为(01n-1)O(n2)。其他情况下还要加上移动元素的次数。 空间效率:O(1)因为仅占用1个缓冲单元 算法的稳定性:稳定因为25*排序后仍然在25的后面。对应程序参见教材P265。,Void InsertSort(SqList / 插入到正确位置 / InsertSort,不需要增加辅助空间若设待排序的对象个数为n,则算法需要进行n-1次插入。最好情况下,排序前对象已经按关键码大小从小到大有序,每趟只需与前面的有序对象序列的最后一个
8、对象的关键码比较 1 次,对象不需要移动 。因此,总的关键码比较次数为n-1。,直接插入排序的算法分析,最坏情况下,第i趟插入时,第i个对象必须与前面i-1个对象都做关键码比较,并且每做 1 次比较就要做 1 次数据移动。则总的关键码比较次数KCN和对象移动次数RMN分别为,若待排序对象序列中出现各种可能排列的概率相同,则可取上述最好情况和最坏情况的平均情况。在平均情况下的关键码比较次数和对象移动次数约为 n2/4。因此,直接插入排序的时间复杂度为 o(n2)。直接插入排序是一种稳定的排序方法。,2) 折半插入排序,优 点:比较的次数大大减少。 时间效率:虽然比较次数大大减少,可惜移动次数并未
9、减少, 所以排序效率仍为O(n2) 。 空间效率: O(1) 稳 定 性:稳定对应程序见教材P267(仅用于顺序表),新元素插入到哪里?,在已形成的有序表中折半查找,并在适当位置插入,把原来位置上的元素向后顺移。,Void BInsertSort (SqList &L) / 折半插入排序 for ( i=2;i=high+1;-j) L.r j+1 = L.r j;/ 记录后移L.r high+1 = L.r 0; / 插入 / for / BInsertSort,初始,i=2,i=2,i=2,i=2,初始,i=8,i=8,i=8,初始,i=8,i=8,i=8,i=8,初始,i=8,i=8,i
10、=8,i=8,折半插入排序的算法分析,折半查找比顺序查找快,所以折半插入排序就平均性能来说比直接插入排序要快。 在插入第 i 个对象时,需要经过 log2i +1 次关键码比较,才能确定它应插入的位置。 折半插入排序是一个稳定的排序方法。,讨论:若记录是链表结构,用直接插入排序行否?折半插入排序呢? 答:直接插入不仅可行,而且还无需移动元素,时间效率更高!但链表无法“折半”!折半插入排序的改进2-路插入排序见教材P267。(1)基本思想: P267(2)举 例:P268 图10.2(3)算法分析:移动记录的次数约为n2/8 2-路插入排序只能减少移动记录的次数,而不能绝对避免移动记录。实现是借
11、助循环向量。= 若希望在排序过程中不移动记录,只有改变存储结构,进行表插入排序。,4)希尔(shell)排序(又称缩小增量排序),基本思想:先将整个待排记录序列分割成若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录进行一次直接插入排序。 技巧:子序列的构成不是简单地“逐段分割”,而是将相隔某个增量dk的记录组成一个子序列,让增量dk逐趟缩短(例如依次取5,3,1),直到dk1为止。 优点:让关键字值小的元素能很快前移,且序列若基本有序时,再用直接插入排序处理,时间效率会高很多。,38,例:关键字序列 T=(49,38,65,97, 76, 13, 27, 49*
12、,55, 04),请写出希尔排序的具体实现过程。,初 态:,第1趟 (dk=5),第2趟 (dk=3),第3趟 (dk=1),49,13,13,49,38,27,65,49*,97,55,76,04,27,38,65,49*,97,55,13,55,76,04,55,13,27,04,27,04,49,49*,49,49*,76,38,76,65,65,97,97,13,27,04,49*,76,97,算法分析:开始时dk 的值较大,子序列中的对象较少,排序速度较快;随着排序进展,dk 值逐渐变小,子序列中对象个数逐渐变多,由于前面工作的基础,大多数对象已基本有序,所以排序速度仍然很快。,ri
13、,void ShellSort(SqList &L,int dlta ,int t)/按增量序列dlta0t-1对顺序表L作Shell排序for(k=0;kt;+k)ShellSort(L,dltak); /增量为dltak的一趟插入排序 / ShellSort,时间效率:,空间效率:O(1)因为仅占用1个缓冲单元 算法的稳定性:不稳定因为49*排序后却到了49的前面,希尔排序算法(主程序),参见教材P272,O(n1.25)O(1.6n1.25)经验公式,dk值依次装在dltat中,附:希尔排序算法分析,对特定的待排序对象序列,可以准确地估算关键码的比较次数和对象移动次数。但想要弄清关键码比
14、较次数和对象移动次数与增量选择之间的依赖关系,并给出完整的数学分析,还没有人能够做到。 Knuth利用大量的实验统计资料得出,当n很大时,关键码平均比较次数和对象平均移动次数大约在 n1.25 到 1.6n1.25 的范围内。这是在利用直接插入排序作为子序列排序方法的情况下得到的。,void ShellInsert(SqList j=j-dk)rj+dk=rj;rj+dk=r0; ,希尔排序算法(其中某一趟的排序操作),参见教材P272,/对顺序表L进行一趟增量为dk的Shell排序,dk为步长因子,/开始将ri 插入有序增量子表,/暂存在r0,/关键字较大的记录在子表中后移,/在本趟结束时将
15、ri插入到正确位置,课堂练习:,1. 欲将序列(Q, H, C, Y, P, A, M, S, R, D, F, X)中的关键码按字母升序重排,则初始步长为4的希尔排序一趟的结果是? 答:原始序列: Q, H, C, Y, P, A, M, S, R, D, F, Xshell一趟后:,2. 以关键字序列(256,301,751,129,937,863,742,694,076,438)为例,分别写出执行以下算法的各趟排序结束时,关键字序列的状态,并说明这些排序方法中,哪些易于在链表(包括各种单、双、循环链表)上实现? 直接插入排序 希尔排序(取dk=5,3,1),答:显然,直接插入排序方法易于
16、在链表上实现;但希尔排序方法因为是按增量选择记录,不易于在链表上实现。两种排序方法的中间状态分别描述如后:,原始序列: 256,301,751,129,937,863,742,694,076,438,256,301,751,129,937,863,742,694,076,438 256,301,751,129,937,863,742,694,076,438 129,256,301,751,937,863,742,694,076,438 129,256,301,751,937,863,742,694,076,438 129,256,301,751,863,937,742,694,076,438
17、129,256,301,742,751,863,937,694,076,438 129,256,301,694,742,751,863,937,076,438 076,129,256,301,694,742,751,863,937,438 076,129,256,301,438,694,742,751,863,937,直接插入排序,第1趟 第2趟 第3趟 第4趟 第5趟 第6趟 第7趟 第8趟 第9趟,原始序列: 256,301,751,129,937,863,742,694,076,438,希尔排序,(取dk=5,3,1),256,301,751,129,937,863,742,694,07
18、6,438,256,301,751,129,937,863,742,694,076,438,256,301,694,129,937,863,742,751,076,438,256,301,694,076,937,863,742,751,129,438,256,301,694,076,438,863,742,751,129,937,第1趟 dk=5 第2趟 dk=3 第3趟 dk=1,256,301,694,076,438,863,742,751,129,937,256,301,694,076,438,863,742,751,129,937,076,301,694,256,438,863,742
19、,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,694,256,438,863,742,751,129,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,301,129,256,438,694,742,751,863,937,076,129,256,301,438,694,742,751,863,937,10.3 交换排序,两两比较待排序记录的关键码,如果发生逆序(即排列顺序与排序后的次序正好相反
20、),则交换之,直到所有记录都排好序为止。,交换排序的主要算法有:1) 冒泡排序2) 快速排序,交换排序的基本思想是:,1) 冒泡排序,基本思路:每趟不断将记录两两比较,并按“前小后大”(或“前大后小”)规则交换。 优点:每趟结束时,不仅能挤出一个最大值到最后面位置,还能同时部分理顺其他元素;一旦下趟没有交换发生,还可以提前结束排序。 前提:顺序存储结构,例:关键字序列 T=(21,25,49,25*,16,08),请写出冒泡排序的具体实现过程。,21,25,49, 25*,16, 08 21,25,25*,16, 08 , 49 21,25, 16, 08 ,25*,49 21,16, 08
21、,25, 25*,49 16,08 ,21, 25, 25*,49 08,16, 21, 25, 25*,49,初态: 第1趟 第2趟 第3趟 第4趟 第5趟,for(j=0;jai+1) / 需要互换 t=ai;ai=ai+1;ai+1=t;,冒泡排序的算法分析,时间效率:O(n2) 因为要考虑最坏情况 空间效率:O(1) 只在交换时用到一个缓冲单元 稳 定 性: 稳定 25和25*在排序前后的次序未改变,详细分析: 最好情况:初始排列已经有序,只执行一趟起泡,做 n-1 次关键码比较,不移动对象。 最坏情形:初始排列逆序,算法要执行n-1趟起泡,第i趟 (1 i n) 做了n- i 次关键
22、码比较,执行了n-i 次对象交 换。此时的比较总次数KCN和记录移动次数RMN为:,2) 快速排序,从待排序列中任取一个元素 (例如取第一个) 作为中心,所有比它小的元素一律前放,所有比它大的元素一律后放,形成左右两个子表;然后再对各子表重新选择中心元素并依此规则调整,直到每个子表的元素只剩一个。此时便为有序序列了。,基本思想:,优点:因为每趟可以确定不止一个元素的位置,而且呈指数增加,所以特别快! 前提:顺序存储结构,( ),,设以首元素为枢轴中心,例1:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序的算法步骤。,21, 25, 49, 25*,16, 08,初态:
23、 第1趟: 第2趟: 第3趟:,讨论: 1. 这种不断划分子表的过程,计算机如何自动实现? 2. “快速排序”是否真的比任何排序算法都快?,08,16,21,25 * , 25,(49),21,08 , 16,,( ),25 * ,49 ,25,(08),16,21,,25 * ,(25,49),讨论1.这种不断划分子表的过程,计算机如何自动实现?,编程时: 每一趟的子表的形成是采用从两头向中间交替式逼近法; 由于每趟中对各子表的操作都相似,主程序可采用递归算法。,见教材P275,int Partition(SqList /以子表的首记录作为支点记录,放入r0单元 (续下页),一趟快速排序算法
24、(针对一个子表的操作),pivotkey=rlow.key; /取支点的关键码存入pivotkey变量,while(low =pivotkey ) - -high;rlow=rhigh; /将比支点小的记录交换到低端;while(lowhigh /将比支点大的记录交换到高端;,rlow=r0; /支点记录到位;return low; /返回支点记录所在位置。 /Partition,Low=high=3,本趟停止,将支点定位并返回位置信息,例2:关键字序列 T=(21,25,49,25*,16,08),请写出快速排序算法的一趟实现过程。,high,low,21,08,25,16,49,25*,3
25、,21,pivotkey=21,08,25,16,49,( 08 ,16 ) 21 ( 25* , 49, 25 ),25*跑到了前面,不稳定!,j从高端扫描 寻找小于pivot的元素,i从低端扫描 寻找大于pivot的元素,一趟快速排序算法流程图,void QSort ( SqList ,整个快速排序的递归算法:,见教材P276,/长度1,/对顺序表L中的子序列r lowhigh 作快速排序,/一趟快排,将r 一分为二,/在左子区间进行递归快排,直到长度为1,/在右子区间进行递归快排,直到长度为1,/QSort,新的low,void QuickSort ( SqList ,对顺序表L进行快速
26、排序的操作函数为:,例3:以关键字序列(256,301,751,129,937,863,742,694,076,438)为例,写出执行快速算法的各趟排序结束时,关键字序列的状态。,原始序列: 256,301,751,129,937,863,742,694,076,438,快速排序,第1趟 第2趟 第3趟 第4趟,256,301,751,129,937,863,742,694,076,438,076,129,256,751,937,863,742,694,301,438,要求模拟算法实现步骤,256,076,301,129,751,256,076,129,256,438,301,694,742,
27、694,863,937,751,076,129,256,438,301,694,742,751,863,937,076,129,256,301,301,694,742,751,863,937,438,076,129,256,301,438,694,742,751,863,937,时间效率:O(nlog2n) 因为每趟确定的元素呈指数增加 空间效率:O(log2n)因为算法的递归性,要用到栈空间 稳 定 性: 不稳定 因为可选任一元素为支点。,快速排序算法详细分析:,可以证明,函数quicksort的平均计算时间也是O(nlog2n)。实验结果表明:就平均计算时间而言,快速排序是我们所讨论的所有
28、内排序方法中最好的一个。 快速排序是递归的,需要有一个栈存放每层递归调用时的指针和参数(新的low和high)。最大递归调用层次数与递归树的深度一致,理想情况为 log2(n+1) 。因此,要求存储开销为 o(log2n)。 最好情况:如果每次划分对一个对象定位后,该对象的左侧子序列与右侧子序列的长度相同,则下一步将是对两个长度减半的子序列进行排序,这是最理想的情况。此时,快速排序的趟数最少。,最坏情况:即待排序对象序列已经按其关键码从小到大排好序的情况下,其递归树成为单支树,每次划分只得到一个比上一次少一个对象的子序列。这样,必须经过 n-1 趟才能把所有对象定位,而且第 i 趟需要经过 n
29、-i 次关键码比较才能找到第 i 个对象的安放位置,总的关键码比较次数将达到n2/2快速排序是一个不稳定的排序方法,讨论2. “快速排序”是否真的比任何排序算法都快?,设每个子表的支点都在中间(比较均衡),则: 第1趟比较,可以确定1个元素的位置; 第2趟比较(2个子表),可以再确定2个元素的位置; 第3趟比较(4个子表),可以再确定4个元素的位置; 第4趟比较(8个子表),可以再确定8个元素的位置; 只需log2n 1趟便可排好序。,基本上是!因为每趟可以确定的数据元素是呈指数增加的!,而且,每趟需要比较和移动的元素也呈指数下降,加上编程时使用了交替逼近技巧,更进一步减少了移动次数,所以速度
30、特别快。,教材P276有证明:快速排序的平均排序效率为O(nlog2n); 但最坏情况(例如已经有序)下仍为O(n2),改进措施见P277。,10.4 选择排序,选择排序有多种具体实现算法:1) 简单选择排序2) 锦标赛排序3) 堆排序,选择排序的基本思想是:每一趟在后面n-i 个待排记录中选取关键字最小的记录作为有序序列中的第i 个记录。,1)简单选择排序,思路简单:每经过一趟比较就找出一个最小值,与待排序列最前面的位置互换即可。 首先,在n个记录中选择最小者放到r1位置;然后,从剩余的n-1个记录中选择最小者放到r2位置;如此进行下去,直到全部有序为止。,优点:实现简单 缺点:每趟只能确定
31、一个元素,表长为n时需要n-1趟 前提:顺序存储结构,例:关键字序列T= (21,25,49,25*,16,08),请给出简单选择排序的具体实现过程。,原始序列: 21,25,49,25*,16,08,直接选择排序,第1趟 第2趟 第3趟 第4趟 第5趟,08,25,49,25*,16,21 08,16, 49,25*,25,21 08,16, 21,25*,25,49 08,16, 21,25*,25,49 08,16, 21,25*,25,49,时间效率: O(n2)虽移动次数较少,但比较次数仍多。 空间效率:O(1)交换时用到一个暂存单元! 算法的稳定性:不稳定因为排序时,25*到了25
32、的前面。,最小值 08 与r1交换位置,简单选择排序的算法如下:(亦可参见教材P276),Void SelectSort(SqList /SelectSort,/对顺序表L作简单选择排序,/选择第i小的记录,并交换到位,/在riL.length中选择key最小的记录,/与第i个记录交换,讨论:能否利用(或记忆)首趟的n-1次比较所得信息,从而尽量减少后续比较次数呢?答:能!请看锦标赛排序和堆排序!,2) 锦标赛排序 (又称树形选择排序),基本思想:与体育比赛时的淘汰赛类似。首先对 n 个记录的关键字进行两两比较,得到 n/2 个优胜者(关键字小者),作为第一步比较的结果保留下来。然后在这 n/
33、2 个较小者之间再进行两两比较,如此重复,直到选出最小关键字的记录为止。 优点:减少比较次数,加快排序速度 缺点:空间效率低,例:关键字序列T= (21,25,49,25*,16,08,63),请给出锦标赛排序的具体实现过程。,Winner (胜者),r1,注:为便于自动处理,建议每个记录多开两个特殊分量:,初态:,补足2k( k=log2n )个叶子结点,胜者树,第一趟:,第二趟:,16,16,16,r2,Winner (胜者),求次小值16时,只需比较2次,即只比较log2n -1次。,令其Tag0,不参与比较,令其Tag0,不参与比较,第三趟:,r3,Winner (胜者),63,21,
34、第四趟:,r4,Winner (胜者),25,25,25,第五趟:,r5,Winner (胜者),25*,25*,第六趟:,r6,Winner (胜者),49,49,49,第七趟:,r7,Winner (胜者),63,算法分析:,锦标赛排序构成的树是满(完全)二叉树,其深度为 log2n +1,其中 n 为待排序元素个数。 时间复杂度:O(nlog2n) n个记录各自比较约log2n次 空间效率: O(n) 胜者树的附加内结点共有n-1个! 稳定性:稳定 左右结点相同者左为先,讨论:在简单选择排序过程中,每当我们从表中选出最小元素之后,再选次最小元素时,必须把表中剩余元素再扫描一次。这样,同一
35、个元素会被扫描多次,浪费!能否利用上次扫描的结果定出下一次的选择结果呢?答:能!请看堆排序算法,n =2k = 叶子总数,3) 堆排序,1. 什么是堆?,堆的定义:设有n个元素的序列 k1,k2,kn,当且仅当满足下述关系之一时,称之为堆。,或者,i=1, 2, n/2,解释:如果让满足以上条件的元素序列 (k1,k2,kn)顺次排成一棵完全二叉树,则此树的特点是:树中所有结点的值均大于(或小于)其左右孩子,此树的根结点(即堆顶)必最大(或最小)。,2. 怎样建堆?,3. 怎样堆排序?,(大根堆),例:,有序列T1=(08, 25, 49, 46, 58, 67)和序列T2=(91, 85,
36、76, 66, 58, 67, 55),判断它们是否 “堆”?,(小根堆),(小顶堆) (最小堆),(大顶堆) (最大堆),步骤:从最后一个非终端结点开始往前逐步调整,让每个双亲大于(或小于)子女,直到根结点为止。,例:关键字序列T= (21,25,49,25*,16,08),请建大根堆。,2. 怎样建堆?,解:为便于理解,先将原始序列画成完全二叉树的形式:,完全二叉树的第一个非终端结点编号必为n/2 !(性质5),注:终端结点(即叶子)没有任何子女,无需单独调整。,21,i=3: 49大于08,不必调整; i=2: 25大于25*和16,也不必调整; i=1: 21小于25和49,要调整!,
37、49,而且21还应当向下比较!,Void HeapAdjust(HeapType / 插入,关键:将堆的当前顶点输出后,如何将剩余序列重新调整为堆? 方法:将当前顶点与堆尾记录交换,然后仿建堆动作重新调整,如此反复直至排序结束。,3. 怎样进行堆排序?,交换 1号与 6 号记录,例:对刚才建好的大根堆进行排序:,08 25 21 25* 16 49,从 1 号到 5 号 重新 调整为最大堆,08,25,25*,25 08 21 25* 16 49,08,25 25* 21 08 16 49,从 1号到 4号 重新 调整为最大堆,从 1 号到 3号 重新 调整为最大堆,16 08 21 25*
38、25 49,从 1 号到 2 号 重新 调整为最大堆,堆排序的算法,参见教材P281-282,这是针对结点i 的堆调整函数(也是建堆函数),每次调用耗时O(log2n),附1:基于初始堆进行堆排序的算法步骤:,比较左右孩子大小,j指向大者,比较大孩子与rc的大小 若大向上浮,附2: 算法流程,堆排序算法分析:,时间效率: O(nlog2n)。因为整个排序过程中需要调用n-1次HeapAdjust( )算法,而算法本身耗时为log2n; 空间效率:O(1)。仅在第二个for循环中交换记录时用到一个临时变量temp。 稳定性: 不稳定。 优点:对小文件效果不明显,但对大文件有效。,10.5 归并排
39、序,归并排序的基本思想是:将两个(或以上)的有序表组成新的有序表。 更实际的意义:可以把一个长度为n 的无序序列看成是 n 个长度为 1 的有序子序列 ,首先做两两归并,得到 n / 2 个长度为 2 的子序列 ;再做两两归并,如此重复,直到最后得到一个长度为 n 的有序序列。,例:关键字序列T= (21,25,49,25*,93,62,72,08,37,16,54),请给出归并排序的具体实现过程。,len=1,len=2,len=4,len=8,len=16,整个归并排序仅需log2n 趟,一趟归并排序算法: (两路有序并为一路) 参见教材P283,void Merge (SR, / 将剩余
40、的SRjn复制到TR / Merge,void MSort (SR,/ 将TR2 sm和TR2 m+1t归并到TR1 st / MSort,递归形式的两路归并排序算法: 参见教材P284 (一路无序变为有序),简言之,先由“长”无序变成“短”有序, 再从“短”有序归并为“长”有序。,初次调用时为(L, L, 1, length),归并排序算法分析:,时间效率: O(nlog2n) 一趟归并排序的操作是:调用n/2h次算法merge将SR1n中前后相邻且长度为h的有序段进行两两归并,得到前后相邻长度为2h的有序段,并存放在TR1n中,整个归并排序需要进行log2n趟,所以算法总的时间复杂度为O(
41、nlog2n)。空间效率: O(n) 因为需要一个与原始序列同样大小的辅助序列(TR)。这正是此算法的缺点。稳定性:稳定,各种内部排序按所采用的基本思想(策略)可分为: 插入排序、交换排序、选择排序、归并排序和基 数排序。它们的基本策略分别是: 1) 插入排序:依次将无序序列中的一个记录,按关键字值的大小插入到已排好序一个子序列的适当位置,直到所有的记录都插入为止。具体的方法有:直接插入、表插入、2-路插入和shell排序。2) 交换排序:对于待排序记录序列中的记录,两两比较记录的关键字,并对反序的两个记录进行交换,直到整个序列中没有反序的记录偶对为止。具体的方法有:冒泡排序、快速排序。,各种
42、内部排序方法的比较 (教材P289),3) 选择排序:不断地从待排序的记录序列中选取关键字最小的记录,放在已排好序的序列的最后,直到所有记录都被选取为止。具体的方法有:简单选择排序、堆排序。4) 归并排序:利用“归并”技术不断地对待排序记录序列中的有序子序列进行合并,直到合并为一个有序序列为止。5 )基数排序:按待排序记录的关键字的组成成分(“位”)从低到高(或从高到低)进行。每次是按记录关键字某一“位”的值将所有记录分配到相应的桶中,再按桶的编号依次将记录进行收集,最后得到一个有序序列。,各种内部排序方法的比较 (教材P289),各种内部排序方法的比较 (教材P289),讨论:若初始记录基本无序,则选用哪些排序方法比较适合?若初始记录基本无序,则最好选用哪些排序方法?,答:对基本有序的情况,可选用直接插入、堆排序、冒泡排序、归并排序等方法;在基本无序的情况下,最好选用快速排序、希尔排序。,