1、本科毕业论文(设计)题 目 贪心算法设计及其实际应用研究 系 别 信 息 管 理 系 专 业 计算机科学与技术 年 级 2006 级 学 号 222006602054062 姓 名 蒋 远 丽 指 导 教 师 汪 维 清 成 绩 _二一年五月十五日 目 录西南大学本科毕业论文(设计)任务书 I文献综述 i西南大学本科毕业论文(设计)开题报告 - 1 -正文 1摘要 1第 1 章 引言 .21.1 研究背景 21.2 研究内容 21.3 研究目标 21.4 研究意义 21.5 本文组织 3第 2 章 贪心算法的基本知识概述 .42.1 贪心算法定义 42.2 贪心算法的基本思路及实现过程 42.
2、3 贪心算法的核心 42.4 贪心算法的基本要素 52.5 贪心算法的理论基础 62.6 贪心算法存在的问题 7第 3 章 经典问题解决及其优缺点 .83.1 哈夫曼编码 83.2 单源最短路径问题(Dijkstra 算法) .103.3 最小生成树问题(Prim 算法、Kruskal 算法) .12第 4 章 多处最优服务次序问题 154.1 问题的提出 .154.2 贪心选择策略 .154.3 问题的贪心选择性质 .154.4 问题的最优子结构性质 .154.5 算法结果分析 .16第 5 章 删数问题 175.1 问题的提出 .175.2 贪心算法策略 .175.3 问题的贪心选择性质
3、.175.4 问题的最优子结构性质 .175.5 编码 .18第 6 章 汽车加油问题 196.1 问题的提出 .196.2 编码分析 .196.3 贪心算法策略 .196.4 贪心算法正确性证明 .206.5 贪心算法时间复杂度分析 .20第 7 章 最优合并问题 217.1 问题的提出 .217.2 原理分析 .217.3 算法时间复杂度分析 .21第 8 章 会场安排问题 228.1 问题的提出 .228.2 编码分析 .228.3 贪心算法 .228.4 最优解证明 .238.5 算法时间复杂度分析 .23第 9 章 贪心算法的 C+实现 249.1 C+语言概述 249.2 具体实现
4、步骤 .259.3 程序编码与程序调试 .29第 10 章 总结与展望 .3110.1 总结 3110.2 展望 31参考文献 .32附录 .33致谢 .41本科毕业论文(设计)指导教师评阅表 a本科毕业论文(设计)交叉评阅表 b本科毕业论文(设计)答辩记录 cI西南大学本科毕业论文(设计)任务书论文(设计)题目 贪心算法设计及其实际应用研究 系别、专业 信息管理系计算机科学与技术 学生姓名 蒋远丽 学号 222006602054062 指导教师姓名 汪维清 开题日期 2009 年 11 月 28 日 论文(设计)的主要内容(技术指标)与要求:本文讲述了贪心算法的含义、基本思路及实现过程,贪心
5、算法的核心、基本性质、特点及其存在的问题。并通过贪心算法的性质,通过研究几个经典问题,将贪心算法应用到实际中。进 度 安 排研究进度安排:2009 年 10 月-2009 年 11 月,根据课题研究的内容,收集资料2009 年 11 月- 2009 年 12 月,深入探讨该算法中的几个经典问题2009 年 12 月- 2010 年 1 月,整理研究内容,并作进一步的修改2010 年 1 月- 2010 年 2 月,归纳总结,形成一份完整的课题论文系意见:II注:1、任务书由指导老师填写。 2、任务书必须在第七学期 13 周前下达给学生。文献综述贪心算法设计及其实际应用研究蒋远丽西南大学荣昌校区
6、信息管理系,重庆荣昌 402460摘 要:在求最优解问题的过程中,依据某种贪心标准,从问题的初始状态出发,直接去求每一步的最优解,通过若干次的贪心 选择,最 终得出整个问题的最 优解,这种求解方法就是贪心算法。从贪心算法的定义可以看出,贪 心法并不是从整体上考虑问题 ,它所做出的 选择只是在某种意义上的局部最优解,而由问题自身的特性决定了 该题运用贪心算法可以得到最 优解。 贪心算法所作的选择可以依赖于以往所作过的选择,但决不依 赖于将来的 选择,也不依 赖于子问题的解,因此贪心算法与其它算法相比具有一定的速度优势。如果一个 问题 可以同时用几种方法解决, 贪心算法应该是最好的选择之一。本文
7、讲述了贪心算法的含义、基本思路及实现过程,贪心算法的核心、基本性质、特点及其存在的问题 。并通 过贪心算法的特点举例列出了以往研究 过的几个经典问题,对于实际应用中的问题,也希望通 过贪心算法的特点来解决。关键词:贪心算法;哈夫曼编码;最小生成树;多处最优服务次序问题;删数问题0 引言为了满足人们对大数据量信息处理的渴望,为解决各种实际问题,计算机算法学得到了飞速的发展,线性规划、动态规划、贪心策略等一系列运筹学模型纷纷运用到计算机算法学中,产生了解决各种现实问题的有效算法。虽然设计一个好的求解算法更像是一门艺术而不像是技术 ,但仍然存在一些行之有效的、能够用于解决许多问题的算法设计方法 ,你
8、可以使用这些方法来设计算法 ,并观察这些算法是如何工作的。一般情况下,为了获得较好的性能,必须对算法进行细致的调整。但是在某些情况下,算法经过调整之后性能仍无法达到要求,这时就必须寻求另外的方法来求解该问题。当一个问题具有最优子结构性质和贪心选择性质时,贪心算法通常会给出一个简单、直观和高效的解法。贪心算法通过一系列的选择来得到一个问题的解。它所作的每一个选择都是在当前状态下具有某种意义的最好选择,即贪心选择;并且每ii次贪心选择都能将问题化简为一个更小的与原问题具有相同形式的子问题。尽管贪心算法对许多问题不能总是产生整体最优解,但对诸如最短路径问题、最小生成树问题,以及哈夫曼编码问题等具有最
9、优子结构和贪心选择性质的问题却可以获得整体最优解。而且所给出的算法一般比动态规划算法更加简单、直观和高效。(1)基本知识贪心算法的含义贪心算法是通过一系列的选择来得到问题解的过程。贪心算法是一种能够得到某种度量意义下的最优解的分级处理方法,它总是做出在当前看来是最优的选择,也就是说贪心策略并不是从整体上加以考虑,它所做出的选择只是在某种意义上的局部最优解算法。(2)贪心算法特点及存在的问题1)贪心算法的特点从全局来看,运用贪心策略解决的问题在程序的运行过程中无回溯过程,后面的每一步都是当前看似最佳的选择,这种选择依赖于已做出的选择,但不依赖于未做出的选择。2)贪心算法存在的问题不能保证求得的最
10、后解是最佳的。由于贪心策略总是采用从局部看来是最优的选择,因此并不从整体上加以考虑。 贪心算法只能用来求某些最大或最小解的问题。例如找零钱问题要求得到最小数量,就可以采用贪心算法,但是在另外一个求解权值最小路径时采用贪心算法得到的结果并不是最佳。 贪心算法只能确定某些问题的可行性范围。(3)经典问题解决及其优缺点1)哈夫曼编码问题提出:哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在 20%90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用 0,1 串表示各字符的最优表示方式。基本原理:对每一个字符规定一个 0,1 串作为其代码,并要求任一字符的代码都不是其
11、它字符代码的前缀。这种编码称为前缀码。编码的前缀性质可以使译码方法非常简单。由于任一字符的代码都不是其他字符代码的前缀,从编码文件中不断iii取出代表某一字符的前缀码,转换为原字符,即可逐个译出文件中的所有字符。可以用二叉树作为前缀编码的数据结构。在表示前缀码的二叉树中,树叶代表给定的字符,并将每个字符的前缀码看做是从树根到代表该字符的树叶的一条道路。代码中每一位的 0 或 1 分别作为指示某结点到左儿子或右儿子的“路标”。优点:哈夫曼编码是无损压缩当中最好的方法。它使用预先二进制描述来替换每个符号,长度由特殊符号出现的频率决定。常见的符号需要很少的位来表示,而不常见的符号需要很多位来表示。哈
12、夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。然而,它并不处理符号的顺序和重复或序号的序列。缺点:慢位流实现相当慢的解码(比编码慢)最大的树深度是 32(编码器在任何超过 32 位大小的时候退出)。2)单源最短路径问题提出:给定带权有向图 G=(V,E),其中每条边的权是非负实数。另外,还给定 V 中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。Dijkstra 算法基本思想:设置顶点集合 S 并不断地作贪心选择来扩充这个集合。一个顶点属于集合 S 当且仅当从源到该顶点的最短路径长度已知。初始时
13、,S 中仅含有源。设u 是 G 的某一个顶点,把从源到 u 且中间只经过 S 中顶点的路称为从源到 u 的特殊路径,并用数组 dist 记录当前每个顶点所对应的最短特殊路径长度。Dijkstra 算法每次从 V-S 中取出具有最短特殊路长度的顶点 u,将 u 添加到 S 中,同时对数组dist 作必要的修改。一旦 S 包含了所有 V 中顶点,数组 dist 就记录了从源到所有其它顶点之间的最短路径长度。优点:D ijkstra 的 思 想 是 按 递 增 长 度 来 产 生 路 径 ,每 次 选 出 当 前 已 经 找 到 的最 短 的 一 条 路 径 ,它 必 然 是 一 条 最 终 的 最
14、 短 路 径 。 因 此 每 次 找 出 当 前 距 离 数 组 中最 小 的 ,必 然 是 一 条 最 终 的 最 短 路 径缺点:对于具有 n 个顶点和 e 条边的带权有向图,如果用带权邻接矩阵表示这个图,那么 Dijkstra 算法的主循环体需要 O(n)时间。这个循环需要执行 n-1 次,所以完成循环需要 O(n 2)时间。算法的其余部分所需要时间不超过 O(n 2) 。3)最小生成树问题提出:设 G=(V,E)是无向连通带权图,即一个网络。E 中每条边(v,w)的权iv为 cvw。如果 G 的子图 G是一棵包含 G 的所有顶点的树,则称 G为 G 的生成树。生成树上各边权的总和称为该
15、生成树的耗费。在 G 的所有生成树中,耗费最小的生成树称为 G 的最小生成树。Prim 算法基本思想:首先置 S=1,然后,只要 S 是 V 的真子集,就作如下的贪心选择:选取满足条件 i S,j v-s,且 cij最小的边,将顶点 j 添加到 S 中。这个过程一直进行到 S=V 时为止。在这个过程中选取到的所有边恰好构成 G 的一棵最小生成树。优点:该算法的特点是当前形成的集合 T 始终是一棵树。将 T 中 U 和 TE 分别看作红点和红边集,V-U 看作蓝点集。算法的每一步均是在连接红、蓝点集的紫边中选择一条轻边扩充进 T 中。MST 性质保证了此边是安全的。T 从任意的根 r 开始,并逐
16、渐生长直至 U=V,即 T 包含了 C 中所有的顶点为止。MST 性质确保此时的 T 是 G 的一棵 MST。因为每次添加的边是使树中的权尽可能小,因此这是一种“贪心”的策略。缺点:该算法的时间复杂度为 O(n2)。与图中边数无关,该算法适合于稠密图。 Kruskal 算法基本思想:首先将 G 的 n 个顶点看成 n 个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接两个不同的连通分支:当查看到第 k 条边(v,w)时,如果端点 v 和 w 分别是当前两个不同的连通分支 T1 和 T2 中的顶点时,就用边(v,w)将 T1 和 T2
17、 连接成一个连通分支,然后继续查看第 k+1 条边;如果端点 v 和 w 在当前的同一个连通分支中,就直接再查看第 k+1 条边。这个过程一直进行到只剩下一个连通分支时为止。此时,这个连通分支就是 G 的一棵最小生成树。优点:当输入的连通带权图有 e 条边时,则将这些边依其权组成优先队列需要O(e)时间,在上述算法的 while 循环中,DeleteMin 运算需要 O(loge)时间,因此关于优先队列所作运算的时间为 O(eloge)。实现 UnionFind 所需的时间为 O(eloge)或 O(elog*e)。所以 Kruskal 算法所需的计算时间为 O(eloge)。缺点:当 e=(
18、n 2)时,Kruskal 算法比 Prim 算法差,但当 e=O(n2)时,Kruskal算法却比 Prim 算法好得多。Kruskal 算法的时间主要取决于边数。它较适合于稀疏图。v1 本课程研究的内容通过资料收集、实际调查分析,最终形成自己的观点和见解,拟定以下内容进行探析:(1)基本知识1)贪心算法的含义2)贪心算法的基本思路及实现过程3)贪心算法的核心4)贪心算法的基本性质5)贪心算法的特点6)贪心算法存在的问题(2)经典问题解决及其优缺点1)哈夫曼编码2)单源最短路径问题(Dijkstra 算法)3)最小生成树问题(Prim 算法、Kruskal 算法)(3)贪心算法的实际应用1)
19、多处最优服务次序问题2)删数问题3)汽车加油问题4)最优合并问题5)会场安排问题2 总结贪心算法是很常见的算法,贪心策略是最接近人的日常思维的一种解题策略,虽然它不能保证求得的最后解一定是最佳的,但是它可以为某些问题确定一个可行性范围,因此贪心策略在各级各类信息学竞赛,尤其在对 NPC 类问题的求解中发挥着越来越重要的作用。对于一个问题的最优解只能用穷举法得到时,用贪心算法是寻找问题最优解的较好算法。总之,充分利用贪心算法的优势,从局部最优出发,构造贪心策略比较容易,且简单易行。vi参考文献: 1 严蔚敏,吴伟民.数据结构(c 语言版)M.北京:清华大学出版社,1997 2 M.H.ALSUW
20、AIYEL.算法设计技巧与分析M.北京:电子工业出版社,2004 3 谭浩强.C+面向对象程序设计M.北京:清华大学出版社,20064 常友渠.贪心算法的探讨与研究M.重庆电力高等专科学报,第 13 卷,第 13 期,2008.9.5 龚雄兴,堆与贪心算法M,湖北襄樊学院,2003.6 张洁,朱莉娟.贪心算法与动态规划的比较M.新乡师范高等专科科学学报,第 19 卷,第五期,2005.9.7 殷建平.关于贪心算法的正确性证明M.江西师范大学学报(自然科学版),第 22 卷增刊,1998.10.8 王晓东.计算机算法设计与分析(第 3 版)M北京:电子工业出版社,2007 9 余祥宣,崔国华,邹
21、海明.计算机算法基础M.武汉:华中科技大学出版社,2000 10 卢开澄.计算机算法导引设计与分析M.北京:清华大学出版社,200311 M.H.ALSUWAIYEL.算法设计技巧与分析M.北京电子工业出版社(影印版),51-52.12 朱洪.算法设计和分析M.上海科学技术文献出版社,1989,162-163.13 王晓东.计算算法设计与分析(第二版)M.北京:电子工业出版社,2OO4.14 王晓东.算法设计与分析M.北京:清华大学出版社,2O04.15 苏德富,钟诚.计算机算法设计与分析M.北京:电子工业出版社,2001:60-62.16URL http:/ http:/ http:/ ht
22、tp:/ http:/ MelhiM,Ipson S S,Boothw.A novel triangulation procedure for thinning hand written textJ.Pattern Recognition Letters,2001,22(10):1059-1071.22 Florescu D,Grunhagen A,Kossmann D.XL:A Platform for Web ServicesC.Proc.of the 1st Biennial Conference on innovative Data Systems Research, 2003.vii
23、- 1 -西南大学本科毕业论文(设计)开题报告论文题目 贪心算法设计及其实际应用研究系别专业 信息管理系计算机科学与技术 年 级 2006 级 开题日期 2009 年 11 月 28 日学 号 222006602054062 姓 名 蒋远丽 指导教师 汪维清1.本课题研究意义:为了满足人们对大数据量信息处理的渴望, 为解决各种实际问题 ,计算机算法学得到了飞速的发展,线性规划、动态规划、 贪心策略等一系列运筹学模型纷纷运用到计算机算法学中,产生了解决各种现实问题的有效算法。 虽然设计一个好的求解算法更像是一 门艺术而不像是技术,但仍然存在一些行之有效的、能够用于解决许多问题的算法设计方法,你可
24、以使用这些方法来设计算法,并观察这些算法是如何工作的。一般情况下,为了获得较好的性能,必须对算法进行细致的调整。但是在某些情况下,算法经过调整之后性能仍无法达到要求, 这时就必须寻求另外的方法来求解该问题。当一个问题具有最优子结构性质和贪心选择性质时,贪心算法通常会 给出一个简单、直 观和高效的解法。贪心算法通过 一系列的选择来得到一个问题 的解。它所作的每一个 选择都是在当前状态下具有某种意义的最好选择,即 贪心选择;并且每次 贪心选择都能将问题化简为一个更小的与原问题具有相同形式的子问题。尽管 贪心算法对许 多问题不能总是产生整体最优解,但对诸如最短路径问题、最小生成 树问题,以及哈夫曼
25、编码问题 等具有最优子结构和贪心选择性质的问题却可以获得整体最优解。而且所 给出的算法一般比 动态规划算法更加简单、直 观和高效。2.研究内容:(1)基本知识1)贪心算法的含义2)贪心算法的基本思路及实现过程3)贪心算法的核心4)贪心算法的基本性质5)贪心算法的特点6)贪心算法存在的问题(2)经典问题解决及其优缺点1)哈夫曼编码2)单源最短路径问题(Dijkstra 算法)3)最小生成树问题(Prim 算法、Kruskal 算法)(3)贪心算法的实际应用1)多处最优服务次序问题2)删数问题3)汽车加油问题4)最优合并问题5)会场安排问题- 2 -3.技术路线、研究方法和研究 进度:(1)技术路
26、线题目分析收集资料(网络和图书馆)阅读资料规划论文结构整理资料详细分析整理(贪心算法的基本含义、原理、实现过程、性质、特点、算法优缺点等)分析该算法的实例及其优缺点(哈夫曼编码、单源最短路径问题 (Dijkstra 算法)、最小生成树问题(Prim 算法、Kruskal 算法) )挑选几个经典实例研究并用 c+实现(多处最优服务次序问题、删数问题、汽车加油问题、最优合并问题)总结。(2)研究方法1)文献研究法:通过查询资料来收集研究所需要的基础知识;资料收集方式:利用网络资源、查找相关书籍、收集有关研究课题内容的报刊杂志等;2)个案研究法、实验法:在资料收集完成之上,建立课题研究 结构,思路清
27、楚地对贪心算法的各方面进行分析、探讨 、研究;包括: 贪心算法的基本含 义、基本原理和实现过程,其及贪心算法的性质、贪心算法的特点及 优缺点等,分析由贪心算法解决的几个经典问题的理论以及它们各自的优缺点。从 现实实际出发,从中 选择 几例进行深入研究,并以C+语言实现完成。3)将所研究的内容按合理的思路组合及实例实现完成一篇完整的课题论文;(3)研究进度2009 年 10 月-2009 年 11 月, 根据课题研究的内容,收集资料 2009 年 11 月- 2009 年 12 月, 深入探讨该算法中的几个经典问题2009 年 12 月- 2010 年 1 月, 整理研究内容,并作进一步的修改2
28、010 年 1 月- 2010 年 2 月, 归纳总结,运行程序成功后,形成一份完整的课题论文4.导师意见:指导教师(签名):年 月 日5.系意见:系(盖章) 年 月 日说明:开题报告应在教师指导下由学生独立撰写。在毕业论文(毕业设计)开始二周内完成,交指导教师审阅,并接受学校和学院检查。a正文贪心算法设计及其实际应用研究蒋远丽西南大学荣昌校区信息管理系,重庆荣昌 402460摘要:贪 心 算 法 是 指 ,在 对 问 题 求 解 时 ,总 是 做 出 在 当 前 看 来 是 最 好 的 选 择 ,也 就 是 说 ,不 从 整体 最 优 上 加 以 考 虑 ,他 所 做 出 的 仅 是 在 某
29、 种 意 义 上 的 局 部 最 优 解 。贪 心 算 法 不 是 对 所 有 问 题都 能 得 到 整 体 最 优 解 ,但 对 范 围 相 当 广 泛 的 许 多 问 题 也 能 产 生 整 体 最 优 解 或 者 是 整 体 最 优 解的 近 似 解 。本 文 首 先 介 绍 了 贪 心 算 法 的 核 心 、特 点 及 算 法 本 身 存 在 的 问 题 ,接 下 来 介 绍 了 前 人已 经 研 究 出 来 的 成 果 ,包 括 哈 夫 曼 编 码 、单 源 最 短 路 径 、最 小 生 成 树 等 。然 后 结 合 实 践 ,研 究了 多处最优服务次序问题、删 数问题、汽车加油问题
30、、最优合并问题、会场安排问题等。最后用代 码实现其中的两个问题,对贪心算法的具体 实现方法做了详细说 明。关键字:贪心算法;哈夫曼编码;最小生成树;最优服务次序;汽车加油问题Greedy algorithm design and its practical applicationJiang YuanliDepartment of Information Management, Southwest University, Rongchang, ChongqingAbstract:Greedy algorithm is that, in the problem solving, it always
31、 made in the current appears to be the best option. In other words, not the best on the whole to be considered, he made only a local optimal solution in a sense. Greedy algorithm is not a right that all problems can be the overall optimal solution, but it covers a wide range of issues that he could
32、produce an overall optimal solution or approximate solution of the overall optimal solution. This paper describes the core of the greedy algorithm, characteristics and algorithms inherent problems, then presented the results of our predecessors has been studied out, including Huffman coding, single-
33、source shortest path, minimum spanning tree and so on. Then with practice, study the various optimal service order issues, delete a few issues, car fuel, the optimal merger, venue arrangements and so on. At last, the code to achieve two of them on the greedy algorithm to do the concrete implementati
34、on method in detail.Key words:greedy algorithm;Huffman coding;MST;Optimal service order;Automobile refuelingb第 1 章 引言1.1 研究背景为了满足人们对大数据量信息处理的渴望,为解决各种实际问题,计算机算法学得到了飞速的发展,线性规划、动态规划、贪心策略等一系列运筹学模型纷纷运用到计算机算法学中,产生了解决各种现实问题的有效算法。虽然设计一个好的求解算法更像是一门艺术而不像是技术,但仍然存在一些行之有效的、能够用于解决许多问题的算法设计方法,你可以使用这些方法来设计算法,并观察这些算
35、法是如何工作的。一般情况下,为了获得较好的性能,必须对算法进行细致的调整。但是在某些情况下,算法经过调整之后性能仍无法达到要求,这时就必须寻求另外的方法来求解该问题。当一个问题具有最优子结构性质和贪心选择性质时,贪心算法通常会给出一个简单、直观和高效的解法。贪心算法通过一系列的选择来得到一个问题的解。它所作的每一个选择都是在当前状态下具有某种意义的最好选择,即贪心选择;并且每次贪心选择都能将问题化简为一个更小的与原问题具有相同形式的子问题。尽管贪心算法对许多问题不能总是产生整体最优解,但对诸如最短路径问题、最小生成树问题,以及哈夫曼编码问题等具有最优子结构和贪心选择性质的问题却可以获得整体最优
36、解。而且所给出的算法一般比动态规划算法更加简单、直观和高效。1.2 研究内容贪心算法的定义(是指从问题的初始状态出发,通过若干次的贪心选择而得出最优值(或较优解)的一种解题方法) ,贪心算法的基本要素(最优子结构性质、贪心选择性质) 、贪心算法的思路及过程,贪心算法的核心(贪心策略)及特性(无回溯) 、探讨贪心算法存在的问题。然后分析已有成果运用贪心策略的解法(哈夫曼编码、单源最短路径问题、最小生成树等) ,结合实际中的例子(多处最优服务次序问题、删数问题、汽车加油问题、会场安排问题、最优合并问题) ,对贪心算法进行分析与运用。1.3 研究目标通过本课题的研究来探讨贪心算法理论基础以及对贪心策
37、略在更多实例中的运用做可行的研究,为贪心算法能够运用到更多的实际中的问题作示范。1.4 研究意义贪心算法是计算机算法策略中常用的一个,往往在需要解决一些最优性问题时,都可以应用贪心算法。贪心算法的用法特点有:一是明显的贪心,一般此类应用问题c本身就是贪心;二是贪心数据结构,如:堆,最小树;三是可证明贪心策略的贪心,这是我们最常见的;四是博弈、游戏策略,这些策略大多是贪心;五是求较优解或多次逼近最优解。通过用贪心算法求解以上问题,可以找到解决这些问题的最优算法,为其它的类似问题的解决有示范和例证作用。1.5 本文组织本文从如下方面进行组织:先提出贪心算法的基本知识,再从贪心算法的几个现有的成果研
38、究探讨,然后对贪心算法中的几个经典问题进行研究,写出其中两个问题的代码,最后进行总结。d第 2 章 贪心算法的基本知识概述2.1 贪心算法定义贪心算法可以简单描述为:对一组数据进行排序,找出最小值,进行处理,再找出最小值,再处理。也就是说贪心算法是一种在每一步选择中都采取在当前状态下最好或最优的选择,从而希望得到结果是最好或最优的算法。贪心算法是一种能够得到某种度量意义下的最优解的分级处理方法,通过一系列的选择来得到一个问题的解,而它所做的每一次选择都是当前状态下某种意义的最好选择,即贪心选择。即希望通过问题的局部最优解来求出整个问题的最优解。这种策略是一种很简洁的方法,对许多问题它能产生整体
39、最优解,但不能保证总是有效,因为它不是对所有问题都能得到整体最优解,只能说其解必然是最优解的很好近似值。2.2 贪心算法的基本思路及实现过程2.2.1 贪心的基本思想用局部解构造全局解,即从问题的某一个初始解逐步逼近给定的目标,以尽可能快地求得更好的解。当某个算法中的某一步不能再继续前进时,算法停止。贪心算法思想的本质就是分治,或者说:分治是贪心的基础。每次都形成局部最优解,换一种方法说,就是每次都处理出一个最好的方案。利用贪心策略解题,需要解决两个问题:(1)该题是否适合于用贪心策略求解;(2)如何选择贪心标准,以得到问题的最优/较优解。2.2.2 贪心算法的实现过程(1)应用同一规则 F,
40、将原问题变为一个相似的、但规模更小的子问题;(2)从问题的某一初始解出发:While(能朝给定目标前进一步)求出可行解的一个解元素;(3)由所有解元素组合成问题的一个可行解。2.3 贪心算法的核心贪心算法的核心问题是选择能产生问题最优解的最优度量标准,即具体的贪心策略。e贪心策略是指从问题的初始状态出发,通过若干次的贪心选择而得出最优值(或较优解)的一种解题方法。其实,从“贪心策略”一词我们便可以看出,贪心策略总是做出在当前看来是最优的选择,也就是说贪心策略并不是从整体上加以考虑,它所做出的选择只是在某种意义上的局部最优解,而许多问题自身的特性决定了该题运用贪心策略可以得到最优解或较优解。2.
41、4 贪心算法的基本要素2.4.1 贪心选择性质所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。在动态规划算法中,每步所做的选择往往依赖于相关子问题的解。因而只有在解出相关子问题后,才能做出选择。而在贪心算法中,仅在当前状态下做出最好选择,即局部最优选择。然后再去解做出这个选择后产生的相应的子问题。贪心算法所做的贪心选择可以依赖于以往所做过的选择,但决不依赖于将来所做的选择,也不依赖于子问题的解。正是由于这种差别,动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的
42、方式进行,以迭代的方式做出相继的贪心选择,每做一次贪心选择就将所求问题简化为规模更小的子问题。对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所做的贪心选择最终导致问题的整体最优解。首先考察问题的一个整体最优解,并证明可修改这个最优解,使其以贪心选择开始。做了贪心选择后,原问题简化为规模更小的类似子问题。然后,用数学归纳法证明,通过每一步做贪心选择,最终可得到问题的整体最优解。其中,证明贪心选择后的问题简化为规模更小的类似子问题的关键在于利用该问题的最优子结构性质。2.4.2 最优子结构性质当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。运用贪心策略在每一次
43、转化时都取得了最优解。问题的最优子结构性质是该问题可用贪心算法或动态规划算法求解的关键特征。贪心算法的每一次操作都对结果产生直接影响,而动态规划则不是。贪心算法对每个子问题的解决方案都做出选择,不能回退;动态规划则会根据以前的选择结果对当前进行选择,有回退功能。动态规划主要运用于二维或三维问题,而贪心一般是一维问题。f2.4.3 贪心算法的特点贪心算法的最大特点就是快,通常是线性二次式,不需要多少额外的内存。一般二次方级的存储要浪费额外的空间,而且那些空间经常得不出正解。但是,使用贪心算法时,这些空间可以帮助算法更容易实现且更快执行。如果有正确贪心性质存在,那么一定要采用。因为它容易编写,容易
44、调试,速度极快,并且节约空间。几乎可以说,此时它是所有算法中最好的。但是应该注意,贪心算法有两大难点:(1)如何贪心怎样用一个小规模的解构造更大规模的解呢?总体上,这与问题本身有关。但是大部分都是有规律的。正因为贪心有如此性质,它才能比其他算法快。具有应当采用贪心算法的问题,当“贪心序列”中的每项互异且当问题没有重叠性时,看起来总能通过贪心算法取得(近似)最优解的。或者,总有一种直觉在引导我们对一些问题采用贪心算法。其中“找零钱”这个问题就是一个例子。题中给出的硬币面值事实上具有特殊性,如果面值发生变化,可能贪心算法就不能返回最优解了。但是,值得指出的是,当一个问题具有多个最优解时,贪心算法并
45、不能求出所有最优解。另外,我们经过实践发现,单纯的贪心算法是顺序处理问题的;而且每个结果是可以在处理完一个数据后即时输出的。(2)贪心的正确性要证明贪心性质的正确性,才是贪心算法的真正挑战,因为并不是每次局部最优解都会与整体最优解之间有联系,往往靠贪心算法生成的解不是最优解。这样,贪心性质的证明就成了贪心算法正确的关键。对某些问题贪心性质也许是错的,即使它在大部分数据中都是可行的,但还必须考虑到所有可能出现的特殊情况,并证明该贪心性质在这些特殊情况中仍然正确。而这样容易陷入证明不正确贪心性质的泥塘中无法自拔,因为贪心算法的适用范围并不大,而且有一部分极难证明,若是没有把握,最好不要冒险,还有其
46、他算法会比它要保险。2.5 贪心算法的理论基础正如前文所说的那样,贪心策略是最接近人类认知思维的一种解题策略。但是,越是显而易见的方法往往越难以证明。下面我们就来介绍贪心策略的理论拟阵。“拟阵”理论是一种能够确定贪心策略何时能够产生最优解的理论,虽然这套理论还很不完善,但在求解最优化问题时发挥着越来越重要的作用。拟阵 M 定义为满足下面 3 个条件的有序对(S,I):g(1)S 是非空有限集;(2)I 是 S 的一类具有遗传性质的独立子集族,即若 BI,则 B 是 S 的独立子集,且 B 的任意子集也都是 S 的独立子集。空集必为 I 的成员;(3)I 满足交换性质,即若 AI,BI 且|A|
47、,连接两顶点 vi,vj,边的权为 wp,若加入到树中不能保证树的总长度最短,那么一定有另一条边或另两条边,且 wwp 或 ww,不在最小树中,可知当,加入到树中时已构成回路,此时程序终止,因为T,T 且 w+wE,则令 dij=,并假定 dij=Prim 算法的基本思想是:从某一顶点(设为 v1)开始,令 Sv1,求与 S 中点与 S 中点 v1 距离最短的点,即从矩阵 D 的第一行元素中找到最小的元素,设为 dij,则令 SSvj,继续求 vs 中点与 s 的距离最短的点,设为 vk,则令 SSvk,继续以上的步骤,直到 n 个顶点用 n-1 条边连接起来为止。流程如下:(1)初始化操作:
48、T,q(1)-1,i 从 2 到 n 作p(i)1,q(i)di1,k1;(2)若 kn,则作输出 T,结束否则作min,j 从 2 到 n 作若 0t(i)(i1)。 设另一服务序列 B=(t(i),t(2),t(1),t(n))那么 TA-TB=n*t(1)-t(i)+(n+1-i)t(i)-t(1)=(1-i)*t(i)-t(1)0即 TATB,这与 A 是最优服务相矛盾。 故最优服务次序问题满足贪心选择性质。4.4 问题的最优子结构性质在进行了贪心选择后,原问题 T 就变成了如何安排剩余的 n-1 个顾客的服务次序p的问题 T,是原问题的子问题。若 A 是原问题 T 的最优解,则 A=t(2),t(i)t(n)是服务次序问题子问题T的最优解。证明:假设 A不是子问题 T的最优解,其子问题的最优解为 B,则有