1、几种常见的排序算法之比较(转)2009-09-28 15:26摘要:排序的基本概念以及其算法的种类,介绍几种常见的排序算法的算法:冒泡排序、选择排序、插入排序、归并排序、快速排序、希尔排序的算法和分析它们各自的复杂度,然后以表格的形式,清晰直观的表现出它们的复杂度的不同。在研究学习了之前几种排序算法的基础上,讨论发现一种新的排序算法,并通过了进一步的探索,找到了新的排序算法较之前几种算法的优势与不足。关键词:排序,算法复杂度,创新算法一、引言排序算法,是计算机编程中的一个常见问题。在日常的数据处理中,面对纷繁的数据,我们也许有成百上千种要求,因此只有当数据经过恰当的排序后,才能更符合用户的要求
2、。因此,在过去的数十载里,程序员们为我们留下了几种经典的排序算法,他们都是智慧的结晶。本文将带领读者探索这些有趣的排序算法,其中包括介绍排序算法的某些基本概念以及几种常见算法,分析这些算法的时间复杂度,同时在最后将介绍我们独创的一种排序方法,以供读者参考评判。二、几种常见算法的介绍及复杂度分析1.基本概念 1.1 稳定排序(stable sort)和非稳定排序稳定排序是所有相等的数经过某种排序方法后,仍能保持它们在排序之前的相对次序。反之,就是非稳定的排序。比如:一组数排序前是 a1,a2,a3,a4,a5,其中 a2=a4,经过某种排序后为a1,a2,a4,a3,a5,则我们说这种排序是稳定
3、的,因为 a2 排序前在 a4 的前面,排序后它还是在 a4 的前面。假如变成 a1,a4,a2,a3,a5 就不是稳定的了。1.2 内排序( internal sorting )和外排序( external sorting) 在排序过程中,所有需要排序的数都在内存,并在内存中调整它们的存储顺序,称为内排序; 在排序过程中,只有部分数被调入内存,并借助内存调整数在外存中的存放顺序排序方法称为外排序。1.3 算法的时间复杂度和空间复杂度所谓算法的时间复杂度,是指执行算法所需要的计算工作量。 一个算法的空间复杂度,一般是指执行这个算法所需要的内存空间。2.几种常见算法 2.1 冒泡排序 (Bubb
4、le Sort)冒泡排序方法是最简单的排序方法。这种方法的基本思想是,将待排序的元素看作是竖着排列的“气泡”,较小的元素比较轻,从而要往上浮。在冒泡排序算法中我们要对这个“气泡”序列处理若干遍。所谓一遍处理,就是自底向上检查一遍这个序列,并时刻注意两个相邻的元素的顺序是否正确。如果发现两个相邻元素的顺序不对,即“轻”的元素在下面,就交换它们的位置。显然,处理一遍之后,“最轻”的元素就浮到了最高位置;处理二遍之后,“次轻”的元素就浮到了次高位置。在作第二遍处理时,由于最高位置上的元素已是“最轻”元素,所以不必检查。一般地,第 i 遍处理时,不必检查第 i 高位置以上的元素,因为经过前面 i-1
5、遍的处理,它们已正确地排好序。冒泡排序是稳定的。算法时间复杂度是 O(n 2)。2.2 选择排序 (Selection Sort)选择排序的基本思想是对待排序的记录序列进行 n-1 遍的处理,第 i 遍处理是将 Lin中最小者与 Li交换位置。这样,经过 i 遍处理之后,前 i 个记录的位置已经是正确的了。选择排序是不稳定的。算法复杂度是 O(n 2 )。2.3 插入排序 (Insertion Sort)插入排序的基本思想是,经过 i-1 遍处理后,L1i-1己排好序。第 i 遍处理仅将 Li插入 L1i-1的适当位置,使得 L1i又是排好序的序列。要达到这个目的,我们可以用顺序比较的方法。首
6、先比较 Li和 Li-1,如果 Li-1 Li,则L1i已排好序,第 i 遍处理就结束了;否则交换 Li与 Li-1的位置,继续比较Li-1和 Li-2,直到找到某一个位置 j(1ji-1),使得 Lj Lj+1时为止。图 1 演示了对 4 个元素进行插入排序的过程,共需要(a),(b),(c)三次插入。直接插入排序是稳定的。算法时间复杂度是 O(n 2)2.4 堆排序堆排序是一种树形选择排序,在排序过程中,将 An看成是完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系来选择最小的元素。堆排序是不稳定的。算法时间复杂度 O(nlog n)。2.5 归并排序设有两个有序
7、(升序)序列存储在同一数组中相邻的位置上,不妨设为Alm,Am+1h,将它们归并为一个有序数列,并存储在 Alh。其时间复杂度无论是在最好情况下还是在最坏情况下均是 O(nlog2n)。2.6 快速排序快速排序是对冒泡排序的一种本质改进。它的基本思想是通过一趟扫描后,使得排序序列的长度能大幅度地减少。在冒泡排序中,一次扫描只能确保最大数值的数移到正确位置,而待排序序列的长度可能只减少 1。快速排序通过一趟扫描,就能确保某个数(以它为基准点吧)的左边各数都比它小,右边各数都比它大。然后又用同样的方法处理它左右两边的数,直到基准点的左右只有一个元素为止。快速排序是不稳定的。最理想情况算法时间复杂度
8、 O(nlog2n),最坏 O(n 2)。2.7 希尔排序在直接插入排序算法中,每次插入一个数,使有序序列只增加 1 个节点,并且对插入下一个数没有提供任何帮助。如果比较相隔较远距离(称为 增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换。D.L.shell于 1959 年在以他名字命名的排序算法中实现了这一思想。算法先将要排序的一组数按某个增量 d 分成若干组,每组中记录的下标相差 d.对每组中全部元素进行排序,然后再用一个较小的增量对它进行,在每组中再进行排序。当增量减到 1 时,整个要排序的数被分成一组,排序完成。 希尔排序是不稳定的。算法时间复杂度是 O(n
9、2)。3.常见算法复杂度比较 序号 排序类别 时间复杂度 空间复杂度 稳定1 插入排序 O(n2) 1 2 希尔排序 O(n2) 1 3 冒泡排序 O(n2) 1 4 选择排序 O(n2) 1 5 快速排序 O(Nlogn) O(logn) 6 堆排序 O(Nlogn) 1 7 归并排序 O(Nlogn) O(n) 三、一个创新算法1.算法描述:2.优缺点分析本算法总共使用了 13 次赋值;而对于同样的待排序数组,冒泡排序需要 28次赋值(14 次交换),选择排序法同样也需要 28 次比较。这说明,新得的算法比以上算法有了明显的提高。最重要的是,新的算法的时间复杂度是 O(n),呈线性关系,明
10、显节省了时间,空间复杂度也为 O(n),但这和时间上的优化相比算不了什么。当 n值很大的时候,该算法有明显的优势。但是这种方法有一定的局限性。首先,要求进行排序数列必须是 int 型的数组,对于字符等怎无能为力;其次,要求进行排序的序列如果是稀疏的,那么回直接影响 B 数组的大小,比如:1,50,600,75,1000000,500 这时如果不做一些必要的修改,本算法至少需要运行 1000000 次。因此,本算法适用于一些密集度较大的数据。再次,只有当要排序的数量很大时才有明显的优势。3.适用范围预测鉴于以上几点分析,本算法适用于密集度较大、整数型的无序数列的排序,如:学生名次的排序等。四、总结排序有着广泛的应用,了解掌握各种排序的算法,做到学以致用有着很强的实用性。本文介绍了几种常用的排序算法,通过描述和分析让你进一步加深对排序算法的理解。除了原有的算法,在思考探究基础上,提出了也有着使用空间的创新算法,充分展示了研究探索精神。排序算法各有优劣,希望阅读本文将在算法选择上给你提供帮助。将排序算法更好的应用于实践中。