1、学习要点 理解贪心算法的概念。 掌握贪心算法的基本要素 (1)最优子结构性质 (2)贪心选择性质 理解贪心算法与动态规划算法的差异 理解贪心算法的一般理论 通过应用范例学习贪心设计策略。 (1)活动安排问题; (2)最优装载问题; (3)哈夫曼编码; (4)单源最短路径; (5)最小生成树; (6)多机调度问题。,1,2,一、贪心算法定义,指的是从对问题的某一初始解出发,一步一步的攀登给定的目标,尽可能快地去逼近更好的解。当达到某一步,不能再攀登时,算法便终止。,二、贪心算法特点,贪心算法总是做出在当前看来是最好的选择,它并不是从总体最优上加以考虑,他所作出的选择只是在某种意义上的局部最优选择
2、。能够得到的解不一定是最优解。,概述,举例:假设有四种硬币25分、10分、5分、1分若干个。要凑够63分,应该怎样取硬币使得硬币个数最少?,描述问题:数组a4存放所取四种硬币 的个数,w4存放四种硬币币值 约束条件 可行解 目标函数,3,如果把硬币换为:一分、五分、一角一分,而找给顾客的是一角五分,4,背包问题:共有n种物品要装入一个背包中,背包可容纳的重量是C,每种物品的容量为wi,每个物品的价值为Vi ,如何装才能获得最大的价值?,用一个向量(x1,x2,x3,xn),表示装的个数多少? 约束条件:0=xi=1,目标函数:,5,假设n=3,C=20, (v1、v2、v3)=(25、24、1
3、5) (w1、w2、w3)=(18、15、10) 求,顾名思义,贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。 当然,希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最短路经问题,最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。,6,4.1 活动安排问题,活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动
4、。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。,7,4.1 活动安排问题,8,设有n个活动的集合E=1,2,n,其中每个活动都要求使用同一资源,而在同一时间内只有一个活动能使用这一资源。每个活动i都有一个要求使用该资源的起始时间si和一个结束时间fi,且si fi 。如果选择了活动i,则它在半开时间区间si, fi)内占用资源。若区间si, fi)与区间sj, fj)不相交,则称活动i与活动j是相容的。也就是说,当sifj或sjfi时,活动i与活动j相容。,4.1 活动安排问题,template void GreedySelector(int n, Type s,
5、 Type f, bool A) A1=true;int j=1;for (int i=2;i=fj) Ai=true; j=i; else Ai=false; ,9,下面给出解活动安排问题的贪心算法GreedySelector :,各活动的起始时间和结束时间存储于数组s和f中且按结束时间的非减序排列,4.1 活动安排问题,由于输入的活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能多的相容
6、活动。算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。,10,4.1 活动安排问题,例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:,11,4.1 活动安排问题,算法greedySelector 的计算过程如左图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。,12,4.1 活动安排问题,若被检查的活动i的开始时间Si小于最近选
7、择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。 贪心算法并不总能求得问题的整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。,13,4.2 贪心算法的基本要素,本节着重讨论可以用贪心算法求解的问题的一般特征。 对于一个具体的问题,怎么知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有2个重要的性质:贪心选择性质和最优子结构性质。,14,4.2 贪心算法的基本要素,1
8、、贪心选择性质,15,所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。 对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。,4.2 贪心算法的基本要素,当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。问题的最优子结构性质是该问题可用动态规划算法或贪
9、心算法求解的关键特征。,16,2、最优子结构性质,4.2 贪心算法的基本要素,贪心算法和动态规划算法都要求问题具有最优子结构性质,这是2类算法的一个共同点。但是,对于具有最优子结构的问题应该选用贪心算法还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?下面研究2个经典的组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。,17,3、贪心算法与动态规划算法的差异,4.2 贪心算法的基本要素,0-1背包问题: 给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?,18,在选择装入背包的物品时
10、,对每种物品i只有2种选择,即装入背包或不装入背包。不能将物品i装入背包多次,也不能只装入部分的物品i。,4.2 贪心算法的基本要素,背包问题: 与0-1背包问题类似,所不同的是在选择物品i装入背包时,可以选择物品i的一部分,而不一定要全部装入背包,1in。,19,这2类问题都具有最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。,4.2 贪心算法的基本要素,首先计算每种物品单位重量的价值Vi/Wi,然后,依贪心选择策略,将尽可能多的单位重量价值最高的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并
11、尽可能多地装入背包。依此策略一直地进行下去,直到背包装满为止。具体算法可描述如下页:,20,用贪心算法解背包问题的基本步骤:,4.2 贪心算法的基本要素,void Knapsack(int n,float M,float v,float w,float x) Sort(n,v,w);int i;for (i=1;ic) break;xi=1;c-=wi; if (i=n) xi=c/wi; ,21,算法knapsack的主要计算时间在于将各种物品依其单位重量的价值从大到小排序。因此,算法的计算时间上界为 O(nlogn)。 为了证明算法的正确性,还必须证明背包问题具有贪心选择性质。,4.2 贪
12、心算法的基本要素,对于0-1背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。事实上,在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另一重要特征。实际上也是如此,动态规划算法的确可以有效地解0-1背包问题。,22,4.3 最优装载,有一批集装箱要装上一艘载重量为c的轮船。其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。,23,对最优装载问题进行形式
13、化描述,24,用一个向量(x1,x2,x3,xn),表示装的个数多少? 约束条件:xi 0,1 ,目标函数:,25,1、算法描述 最优装载问题可用贪心算法求解。 采用重量最轻者先装的贪心选择策略 可产生最优装载问题的最优解。,4.3 最优装载,template void Loading(int x, Type w, Type c, int n) int *t = new int n+1;Sort(w, t, n);for (int i = 1; i = n; i+) xi = 0;for (int i = 1; i = n ,26,4.3 最优装载,2、贪心选择性质可以证明最优装载问题具有贪心
14、选择性质。 3、最优子结构性质最优装载问题具有最优子结构性质。由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法loading的正确性。算法loading的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为 O(nlogn)。,27,4.4 哈夫曼编码,哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用0,1串表示各字符的最优表示方式。给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。 1、前缀码对每一个字符规定一个0,1串作为其代码,并要求任一字符
15、的代码都不是其它字符代码的前缀。这种编码称为前缀码。,28,4.4 哈夫曼编码,编码的前缀性质可以使译码方法非常简单。 表示最优前缀码的二叉树总是一棵完全二叉树,即树中任一结点都有2个儿子结点。平均码长定义为:使平均码长达到最小的前缀码编码方案称为给定编码字符集C的最优前缀码。,29,4.4 哈夫曼编码,2、构造哈夫曼编码哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为哈夫曼编码。哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树T。算法以|C|个叶结点开始,执行|C|1次的“合并”运算后产生最终所要求的树T。,30,4.4 哈夫曼编码,在书上给出的算法huffmanTree中,编
16、码字符集中每一字符c的频率是f(c)。以f为键值的优先队列Q用在贪心选择时有效地确定算法当前要合并的2棵具有最小频率的树。一旦2棵具有最小频率的树合并后,产生一棵新的树,其频率为合并的2棵树的频率之和,并将新树插入优先队列Q。经过n1次的合并后,优先队列中只剩下一棵树,即所要求的树T。算法huffmanTree用最小堆实现优先队列Q。初始化优先队列需要O(n)计算时间,由于最小堆的removeMin和put运算均需O(logn)时间,n1次的合并总共需要O(nlogn)计算时间。因此,关于n个字符的哈夫曼算法的计算时间为O(nlogn) 。,31,4.4 哈夫曼编码,3、哈夫曼算法的正确性要证
17、明哈夫曼算法的正确性,只要证明最优前缀码问题具有贪心选择性质和最优子结构性质。(1)贪心选择性质(2)最优子结构性质,32,4.5 单源最短路径,给定带权有向图G =(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。1、算法基本思想Dijkstra算法是解单源最短路径问题的贪心算法。,33,4.5 单源最短路径,基本思想:设置顶点集合S并不断地作贪心选择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。初始时,S中仅含有源。设u是G的某一
18、个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。一旦S包含了所有V中顶点,dist就记录了从源到所有其它顶点之间的最短路径长度。,34,问题描述:,35,输入带权有向图G=(V,E), V=1,2,n,顶点V1是源 Cij表示边(i,j)的权 disti表示从源到顶点v1的最短特殊路径长度 previ表示从源到顶点i的最短路径上i的前一个顶点。,输入参数:n , v1 , cij 输出参数:disti, p
19、revi,算法描述:,36,基本思想:设置顶点集合S并不断地作贪心选择来扩充这个集合。 Si源点到i顶点的最短路径是否找到 初始化: for(i=1;i=n;i+)si=0;disti=cv1i; Sv1=1,distv1=0; 每次从V-S中取出具有最短特殊路长度的顶点u,并将u添 加到S中 for(num=2;num=n;num+)从dist2到distn选取一顶点u且满足su=0,使 distu=mindist2,dist3,distn;su=1;,37,Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中后,同时对数组dist作必要的修改。 for(j=1;
20、j=n;j+) if(sj=0 整个过程执行n-1次,4.5 单源最短路径,例如,对右图中的有向图,应用Dijkstra算法计算从源顶点1到其它顶点间最短路径的过程列在下页的表中。,38,4.5 单源最短路径,39,Dijkstra算法的迭代过程:,4.5 单源最短路径,2、算法的正确性和计算复杂性 (1)贪心选择性质 (2)最优子结构性质 (3)计算复杂性对于具有n个顶点和e条边的带权有向图,如果用带权邻接矩阵表示这个图,那么Dijkstra算法的主循环体需要 时间。这个循环需要执行n-1次,所以完成循环需要 时间。算法的其余部分所需要时间不超过 。,40,41,练习1:装箱问题,设有编号为
21、0,1,n-1的n种物品,体积分别为V0,V1,Vn-1。将这n种物品装到容量都为V的若干箱子里。约定这n种物品的体积均不超过V,要求使装进这n种物品的箱子数要少。,对适当大的n,找出所有可能的划分要花费的时间是无法承受的。为此,对装箱问题采用非常简单的近似算法,即贪心法。该算法一次将物品放到它第一个能放进去的箱子中,该算法虽不能保证找到最优解,但还是能找到非常好的解。,设有6种物品,它们的体积分别为:60,45,35,20,20,20单位体积,箱子的容量为100单位体积。按上述算法计算,需三只箱子,各箱子所装物品分别为:1,3、2,4,5、6,而最优解为两只箱子。,42,算法:输入箱子的容积
22、;输入物品种数n;按体积从大到小顺序,输入各品种的体积;预置已用箱子链为空;for(i=0;in;i+)从已用的第一只箱子开始顺序寻找能放入物品的箱子j;if(已用箱子都不能再放物品i)另用一只箱子,并将物品i放入该箱子;boxcount+;else 将物品i放入箱子j;,43,练习2:删数问题,键盘输入一个正整数N,去掉其中任意S个数字后剩下的数字按左右次序组成一个新的正整数。对给定的N和S,寻找一种删数规则使得剩下的数字组成的新数最小。,44,#include “string.h“ main() char n10; /*键盘输入的正整数*/int s; /*要删除的数字个数*/int i,j,k;printf(“input the number:“);scanf(“%s“,n);printf(“ninput the delete number“);scanf(“%d“,j+),if()for(k=j;kstrlen(n);k+)nk=nk+1;break;printf(“the result is %s“,n); , njnj+1, nk=0,