收藏 分享(赏)

算法分析与设计课件 贪心算法.ppt

上传人:精品资料 文档编号:10544510 上传时间:2019-11-27 格式:PPT 页数:92 大小:789KB
下载 相关 举报
算法分析与设计课件 贪心算法.ppt_第1页
第1页 / 共92页
算法分析与设计课件 贪心算法.ppt_第2页
第2页 / 共92页
算法分析与设计课件 贪心算法.ppt_第3页
第3页 / 共92页
算法分析与设计课件 贪心算法.ppt_第4页
第4页 / 共92页
算法分析与设计课件 贪心算法.ppt_第5页
第5页 / 共92页
点击查看更多>>
资源描述

1、1,贪心算法,2,学习要点 理解贪心算法的概念。 掌握贪心算法的基本要素 (1)最优子结构性质 (2)贪心选择性质 理解贪心算法与动态规划算法的差异 理解贪心算法的一般理论 通过应用范例学习贪心设计策略。 (1)活动安排问题; (2)最优装载问题; (3)哈夫曼编码; (4)单源最短路径; (5)最小生成树; (6)多机调度问题。,3,顾名思义,贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。当然,希望贪心算法得到的最终结果也是整体最优的。虽然贪心算法不能对所有问题都得到整体最优解,但对许多问题它能产生整体最优解。如单源最

2、短路经问题,最小生成树问题等。在一些情况下,即使贪心算法不能得到整体最优解,其最终结果却是最优解的很好近似。,4,活动安排问题,活动安排问题就是要在所给的活动集合中选出最大的相容活动子集合,是可以用贪心算法有效求解的很好例子。该问题要求高效地安排一系列争用某一公共资源的活动。贪心算法提供了一个简单、漂亮的方法使得尽可能多的活动能兼容地使用公共资源。,5,活动安排问题,设有n个活动的集合E=1,2,n,其中每个活动都要求使用同一资源,如演讲会场等,而在同一时间内只有一个活动能使用这一资源。每个活动i都有一个要求使用该资源的起始时间si和一个结束时间fi,且si fi 。如果选择了活动i,则它在半

3、开时间区间si, fi)内占用资源。若区间si, fi)与区间sj, fj)不相交,则称活动i与活动j是相容的。也就是说,当sifj或sjfi时,活动i与活动j相容。,6,活动安排问题,template void GreedySelector(int n, Type s, Type f, bool A) A1=true;int j=1;for (int i=2;i=fj) Ai=true; j=i; else Ai=false; ,下面给出解活动安排问题的贪心算法GreedySelector :,各活动的起始时间和结束时间存储于数组s和f中且按结束时间的非减序排列,7,活动安排问题,由于输入的

4、活动以其完成时间的非减序排列,所以算法greedySelector每次总是选择具有最早完成时间的相容活动加入集合A中。直观上,按这种方法选择相容活动为未安排活动留下尽可能多的时间。也就是说,该算法的贪心选择的意义是使剩余的可安排时间段极大化,以便安排尽可能多的相容活动。算法greedySelector的效率极高。当输入的活动已按结束时间的非减序排列,算法只需O(n)的时间安排n个活动,使最多的活动能相容地使用公共资源。如果所给出的活动未按非减序排列,可以用O(nlogn)的时间重排。,8,活动安排问题,例:设待安排的11个活动的开始时间和结束时间按结束时间的非减序排列如下:,9,活动安排问题,

5、算法greedySelector 的计算过程如左图所示。图中每行相应于算法的一次迭代。阴影长条表示的活动是已选入集合A的活动,而空白长条表示的活动是当前正在检查相容性的活动。,10,活动安排问题,若被检查的活动i的开始时间Si小于最近选择的活动j的结束时间fi,则不选择活动i,否则选择活动i加入集合A中。 贪心算法并不总能求得问题的整体最优解。但对于活动安排问题,贪心算法greedySelector却总能求得的整体最优解,即它最终所确定的相容活动集合A的规模最大。这个结论可以用数学归纳法证明。,11,贪心算法的基本要素,本节着重讨论可以用贪心算法求解的问题的一般特征。 对于一个具体的问题,怎么

6、知道是否可用贪心算法解此问题,以及能否得到问题的最优解呢?这个问题很难给予肯定的回答。但是,从许多可以用贪心算法求解的问题中看到这类问题一般具有2个重要的性质:贪心选择性质和最优子结构性质。,12,贪心算法的基本要素,1、贪心选择性质,所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的方式进行,以迭代的方式作出相继的贪心选择,每作一次贪心选择就将所求问题简化为规模更小的子问题。 对于一个具体问题,要确定它是否具有贪

7、心选择性质,必须证明每一步所作的贪心选择最终导致问题的整体最优解。,13,贪心算法的基本要素,当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。问题的最优子结构性质是该问题可用动态规划算法或贪心算法求解的关键特征。,2、最优子结构性质,14,贪心算法的基本要素,贪心算法和动态规划算法都要求问题具有最优子结构性质,这是2类算法的一个共同点。但是,对于具有最优子结构的问题应该选用贪心算法还是动态规划算法求解?是否能用动态规划算法求解的问题也能用贪心算法求解?下面研究2个经典的组合优化问题,并以此说明贪心算法与动态规划算法的主要差别。,3、贪心算法与动态规划算法的差异,15,贪心

8、算法的基本要素,0-1背包问题: 给定n种物品和一个背包。物品i的重量是Wi,其价值为Vi,背包的容量为C。应如何选择装入背包的物品,使得装入背包中物品的总价值最大?,在选择装入背包的物品时,对每种物品i只有2种选择,即装入背包或不装入背包。不能将物品i装入背包多次,也不能只装入部分的物品i。,16,贪心算法的基本要素,背包问题: 与0-1背包问题类似,所不同的是在选择物品i装入背包时,可以选择物品i的一部分,而不一定要全部装入背包,1in。,这2类问题都具有最优子结构性质,极为相似,但背包问题可以用贪心算法求解,而0-1背包问题却不能用贪心算法求解。,17,贪心算法的基本要素,首先计算每种物

9、品单位重量的价值Vi/Wi,然后,依贪心选择策略,将尽可能多的单位重量价值最高的物品装入背包。若将这种物品全部装入背包后,背包内的物品总重量未超过C,则选择单位重量价值次高的物品并尽可能多地装入背包。依此策略一直地进行下去,直到背包装满为止。具体算法可描述如下页:,用贪心算法解背包问题的基本步骤:,18,贪心算法的基本要素,void Knapsack(int n,float M,float v,float w,float x) Sort(n,v,w);int i;for (i=1;ic) break;xi=1; c-=wi;if (i=n) xi=c/wi; ,算法knapsack的主要计算时

10、间在于将各种物品依其单位重量的价值从大到小排序。因此,算法的计算时间上界为 O(nlogn)。 为了证明算法的正确性,还必须证明背包问题具有贪心选择性质。,19,贪心算法的基本要素,对于0-1背包问题,贪心选择之所以不能得到最优解是因为在这种情况下,它无法保证最终能将背包装满,部分闲置的背包空间使每公斤背包空间的价值降低了。事实上,在考虑0-1背包问题时,应比较选择该物品和不选择该物品所导致的最终方案,然后再作出最好选择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另一重要特征。实际上也是如此,动态规划算法的确可以有效地解0-1背包问题。,20,最优装载,有一批集装箱要装

11、上一艘载重量为c的轮船。其中集装箱i的重量为Wi。最优装载问题要求确定在装载体积不受限制的情况下,将尽可能多的集装箱装上轮船。 1、算法描述最优装载问题可用贪心算法求解。采用重量最轻者先装的贪心选择策略,可产生最优装载问题的最优解。具体算法描述如下页。,21,最优装载,template void Loading(int x, Type w, Type c, int n) int *t = new int n+1;Sort(w, t, n);for (int i = 1; i = n; i+) xi = 0;for (int i = 1; i = n ,22,最优装载,2、贪心选择性质可以证明最

12、优装载问题具有贪心选择性质。 3、最优子结构性质最优装载问题具有最优子结构性质。由最优装载问题的贪心选择性质和最优子结构性质,容易证明算法loading的正确性。算法loading的主要计算量在于将集装箱依其重量从小到大排序,故算法所需的计算时间为 O(nlogn)。,23,哈夫曼编码,哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用0,1串表示各字符的最优表示方式。给出现频率高的字符较短的编码,出现频率较低的字符以较长的编码,可以大大缩短总码长。 1、前缀码对每一个字符规定一个0,1串作为其代码,并要

13、求任一字符的代码都不是其它字符代码的前缀。这种编码称为前缀码。,24,哈夫曼编码,编码的前缀性质可以使译码方法非常简单。 表示最优前缀码的二叉树总是一棵完全二叉树,即树中任一结点都有2个儿子结点。平均码长定义为:使平均码长达到最小的前缀码编码方案称为给定编码字符集C的最优前缀码。,25,哈夫曼编码,2、构造哈夫曼编码哈夫曼提出构造最优前缀码的贪心算法,由此产生的编码方案称为哈夫曼编码。哈夫曼算法以自底向上的方式构造表示最优前缀码的二叉树T。算法以|C|个叶结点开始,执行|C|1次的“合并”运算后产生最终所要求的树T。,26,构造哈夫曼算法的步骤如下: (1) 用给定的n个权值w1, w2, ,

14、 wn对应的n个结点构成n棵二叉树的森林F=T1, T2, , Tn,其中每一棵二叉树Ti(1in)都只有一个权值为wi的根结点,其左、右子树为空。 (2) 在森林F中选择两棵根结点权值最小的二叉树,作为一棵新二叉树的左、右子树,标记新二叉树的根结点权值为其左右子树的根结点权值之和。 ,(3) 从F中删除被选中的那两棵二叉树, 同时把新构成的二叉树加入到森林F中。(4) 重复(2)、(3)操作, 直到森林中只含有一棵二叉树为止, 此时得到的这棵二叉树就是哈夫曼树。,27,表 6 2 指令的变长编码,28,29,30,可以验证,该编码是前缀编码。若一段程序有1000条指令, 其中I1大约有400

15、条,I2大约有300条,I3大约有150条,I4大约有50条,I5大约有40条,I6大约有30条,I7大约有30条。对于定长编码,该段程序的总位数大约为310003000。采用哈夫曼编码后,该段程序的总位数大约为 1400230031505(50403030)2200。可见,哈夫曼编码中虽然大部分编码的长度大于定长编码的长度3, 却使得程序的总位数变小了。可以算出该哈夫曼编码的平均码长为:,31,举例:数据传送中的二进制编码。 要传送数据 state, seat, act, tea, cat, set, a, eat, 如何使传送的长度最短?首先规定二叉树的构造为左走0,右走1 ,如图6.31

16、所示。为了保证长度最短, 先看字符出现的次数, 然后将出现次数当作权, 如图所示。,32,图6.32 对字符按权排序,字符 s t a e c,字符出现的次数 3 8 7 5 2,图6.33 构造哈夫曼树的过程,按规定:0左1右, 则有,000 001 01 10 112 3 5 7 8c s e a t,33,所以有state 的编码为 00111101101, stat的编码为001111011。构造满足哈夫曼编码的最短最优性质:(1) 若didj(字母不同),则对应的树叶不同。 因此前缀码(任一字符的编码都不是另一个字符编码)不同,一个路径不可能是其它路径的一部分, 所以字母之间可以完全

17、区别。 ,(2) 将所有字符变成二进制的哈夫曼编码, 使带权路径长度最短,相当总的通路长度最短。 若要求传送以上这些编码长度不一的数据, 且还要求传送词间互相区分,应如何设计最优编码呢? 为保证传送词间互相区别,则需加入一空白字符出现频率, 空白字符出现为7, 再构造哈夫曼树,由此得到的哈夫曼编码一定满足最短且又互相区分的性质。,c s e a t 2 3 5 7 7 8,34,6.5.3 哈夫曼编码算法的实现,由于哈夫曼树中没有度为1的结点,则一棵有n个叶子的哈夫曼树共有2n-1个结点,可以用一个大小为2n-1 的一维数组存放哈夫曼树的各个结点。 由于每个结点同时还包含其双亲信息和孩子结点的

18、信息,所以构成一个静态三叉链表。静态三叉链表描述如下:,typedef struct unsigned int weight ; /* 用来存放各个结点的权值*/unsigned int parent, LChild, RChild ; /*指向双亲、 孩子结点的指针*/ HTNode, * HuffmanTree; /*动态分配数组, 存储哈夫曼树*/ typedef char * *HuffmanCode ; /*动态分配数组, 存储哈夫曼编码*/,35,创建哈夫曼树并求哈夫曼编码的算法如下:,HuffmanTree CrtHuffmanTree(HuffmanTree *ht , *Hu

19、ffmanCode , *hc, int * w, int n) /*w存放n个权值, 构造哈夫曼树ht, 并求出哈夫曼编码hc */HuffmanTree ht; m=2*n-1; ht=(HuffmanTree)malloc(m+1)*sizeof(HTNode); /*0号单元未使用*/for(i=1; i=n; i+) hti = wi, 0, 0, 0; /*叶子结点初始化*/for(i=n+1; i=m; i+) hti =0, 0, 0, 0; /*非叶子结点初始化*/for(i=n+1; i=m; i+) /*创建非叶子结点, 建哈夫曼树*/*在ht1hti-1的范围内选择两个

20、parent为0且weight最小的结点,其序号分别赋值给s1、 s2返回*/select(ht, i-1, s1, s2); hts1.parent=i; hts2.parent=i; hti.LChild=s1; hti.RChild=s2; hti.weight=hts1.weight+hts2.weight; /*哈夫曼树建立完毕*/,36,/*从叶子结点到根, 逆向求每个叶子结点对应的哈夫曼编码*/ hcode=(HuffmanCode)malloc(n+1)*sizeof(char *); /*分配n个编码的头指针*/ cd=(char * )malloc(n * sizeof(c

21、har ); /*分配求当前编码的工作空间*/ cdn-10; /*从右向左逐位存放编码, 首先存放编码结束符*/ for(i=1; i=n; i+) /*求n个叶子结点对应的哈夫曼编码*/, start=n-1; /*初始化编码起始指针*/for(c=i, p=hti.parent; p! =0; c=p, p=htp.parent) /*从叶子到根结点求编码*/if (htp.LChild=c) cd-start=0; /*左分支标0*/ else cd-start=1; /*右分支标1*/hcodei=(char *) malloc(n-start)*sizeof(char); /*为第

22、i个编码分配空间*/strcpy(hcodei, ,数组ht的前n个分量表示叶子结点,最后一个分量表示根结点。 每个叶子结点对应的编码长度不等,但最长不超过n。,37,单源最短路径,给定带权有向图G =(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。1、算法基本思想Dijkstra算法是解单源最短路径问题的贪心算法。,38,单源最短路径,其基本思想是,设置顶点集合S并不断地作贪心选择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。初始

23、时,S中仅含有源。设u是G的某一个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。一旦S包含了所有V中顶点,dist就记录了从源到所有其它顶点之间的最短路径长度。,39,单源最短路径,例如,对右图中的有向图,应用Dijkstra算法计算从源顶点1到其它顶点间最短路径的过程列在下页的表中。,40,单源最短路径,Dijkstra算法的迭代过程:,41,从源点到终点的路径可能存在三种情况:一种是没有路径;一种是只有

24、一条路经,则该路径即为最短路径;第三种是,存在多条路径,则其中必存在一条最短路径。例如,图所示有向网G=(V,E),已知源点v0,求v0到其它各顶点的最短路径。从源点v0到v5没有路径;从源点v0到v1只有一条路径(v0,v1);从源点v0到v4有两条路径,其中以长度为15的路径(v0,v2,v4)为最短路径。,42,如何求得从源点到各终点的最短路径?迪杰斯特拉(Dijkstra)提出了一种按路径长度递增的次序求从源点到各终点的最短路径的算法。首先引进辅助向量dist,它的每个分量disti表示已经找到的且从开始点v0到每个终点vi的当前最短路径的长度。它的初态为:如果从v0到vi有弧,则di

25、sti为弧的权值;否则disti为。显然,长度为distj=Mindisti| viV的路径是从v0出发的长度最短的一条最短路径,此路径为(v0,vj)。,43,那么,下一条长度次短的路径是那一条呢?设该次短路径的终点是vk,则这条路径或者是弧(v0,vk),或者是(v0,vj,vk)。它的长度或者是从v到vk的弧上的权值,或者是distj和从vj到vk的弧上的权值之和。引进集合S,用于存放已经求得的最短路径的终点。一般情况下,下一条长度次短的最短路径的长度是distj=Mindisti|viV-S其中,disti或者是弧(v0,vi)上的权值,或者是distk(vkS)和弧(vk,vi)上的

26、权值之和。,44,根据以上分析,可以将迪杰斯特拉算法总结如下:1.g为用邻接矩阵表示的带权图;S集合为已找到的从v0出发的最短路径的终点集合,它的初态为v0;disti=g.arcs0i;2.选择vk,使得distk=Mindisti|viV-S vk就是当前求得的一条从v0出发的最短路径的终点。令 S=Sk3.修改从v0出发到集合V-S上任一顶点vi可达的最短路径长度。如果distk+g.arcskidisti则将disti修改为: distk+g.arcski4.重复2、3步n-1次,即可求得最短路径长度的递增顺序,逐个求出v0到图其它每个顶点的最短路径。,45,46,最小生成树,设G =

27、(V,E)是无向连通带权图,即一个网络。E中每条边(v,w)的权为cvw。如果G的子图G是一棵包含G的所有顶点的树,则称G为G的生成树。生成树上各边权的总和称为该生成树的耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树。网络的最小生成树在实际中有广泛应用。例如,在设计通信网络时,用图的顶点表示城市,用边(v,w)的权cvw表示建立城市v和城市w之间的通信线路所需的费用,则最小生成树就给出了建立通信网络的最经济的方案。,47,最小生成树,1、最小生成树性质用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节介绍的构造最小生成树的Prim算法和Kruskal算法都可以看作是应用贪

28、心算法设计策略的例子。尽管这2个算法做贪心选择的方式不同,它们都利用了下面的最小生成树性质:设G=(V,E)是连通带权图,U是V的真子集。如果(u,v)E,且uU,vV-U,且在所有这样的边中,(u,v)的权cuv最小,那么一定存在G的一棵最小生成树,它以(u,v)为其中一条边。这个性质有时也称为MST性质。,48,最小生成树,2、Prim算法 设G=(V,E)是连通带权图,V=1,2,n。构造G的最小生成树的Prim算法的基本思想是:首先置S=1,然后,只要S是V的真子集,就作如下的贪心选择:选取满足条件iS,jV-S,且cij最小的边,将顶点j添加到S中。这个过程一直进行到S=V时为止。在

29、这个过程中选取到的所有边恰好构成G的一棵最小生成树。,49,最小生成树,利用最小生成树性质和数学归纳法容易证明,上述算法中的边集合T始终包含G的某棵最小生成树中的边。因此,在算法结束时,T中的所有边构成G的一棵最小生成树。 例如,对于右图中的带权图,按Prim算法选取边的过程如下页图所示。,50,最小生成树,51,最小生成树,在上述Prim算法中,还应当考虑如何有效地找出满足条件iS,jV-S,且权cij最小的边(i,j)。实现这个目的的较简单的办法是设置2个数组closest和lowcost。在Prim算法执行过程中,先找出V-S中使lowcost值最小的顶点j,然后根据数组closest选

30、取边(j,closestj),最后将j添加到S中,并对closest和lowcost作必要的修改。用这个办法实现的Prim算法所需的计算时间为,52,最小生成树,3、Kruskal算法Kruskal算法构造G的最小生成树的基本思想是,首先将G的n个顶点看成n个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接2个不同的连通分支:当查看到第k条边(v,w)时,如果端点v和w分别是当前2个不同的连通分支T1和T2中的顶点时,就用边(v,w)将T1和T2连接成一个连通分支,然后继续查看第k+1条边;如果端点v和w在当前的同一个连通分支中,就

31、直接再查看第k+1条边。这个过程一直进行到只剩下一个连通分支时为止。,53,最小生成树,例如,对前面的连通带权图,按Kruskal算法顺序得到的最小生成树上的边如下图所示。,54,最小生成树,关于集合的一些基本运算可用于实现Kruskal算法。 按权的递增顺序查看等价于对优先队列执行removeMin运算。可以用堆实现这个优先队列。 对一个由连通分支组成的集合不断进行修改,需要用到抽象数据类型并查集UnionFind所支持的基本运算。当图的边数为e时,Kruskal算法所需的计算时间是 。当 时,Kruskal算法比Prim算法差,但当 时,Kruskal算法却比Prim算法好得多。,55,多

32、机调度问题,多机调度问题要求给出一种作业调度方案,使所给的n个作业在尽可能短的时间内由m台机器加工处理完成。这个问题是NP完全问题,到目前为止还没有有效的解法。对于这一类问题,用贪心选择策略有时可以设计出较好的近似算法。,约定,每个作业均可在任何一台机器上加工处理,但未完工前不允许中断处理。作业不能拆分成更小的子作业。,56,多机调度问题,采用最长处理时间作业优先的贪心选择策略可以设计出解多机调度问题的较好的近似算法。按此策略,当 时,只要将机器i的0, ti时间区间分配给作业i即可,算法只需要O(1)时间。当 时,首先将n个作业依其所需的处理时间从大到小排序。然后依此顺序将作业分配给空闲的处

33、理机。算法所需的计算时间为O(nlogn)。,57,多机调度问题,例如,设7个独立作业1,2,3,4,5,6,7由3台机器M1,M2和M3加工处理。各作业所需的处理时间分别为2,14,4,16,6,5,3。按算法greedy产生的作业调度如下图所示,所需的加工时间为17。,58,贪心算法的理论基础,借助于拟阵工具,可建立关于贪心算法的较一般的理论。这个理论对确定何时使用贪心算法可以得到问题的整体最优解十分有用。 1、拟阵拟阵M定义为满足下面3个条件的有序对(S,I):(1)S是非空有限集。(2)I是S的一类具有遗传性质的独立子集族,即若BI,则B是S的独立子集,且B的任意子集也都是S的独立子集

34、。空集必为I的成员。(3)I满足交换性质,即若AI,BI且|A|B|,则存在某一元素xB-A,使得AxI。,59,贪心算法的理论基础,例如,设S是一给定矩阵中行向量的集合,I是S的线性独立子集族,则由线性空间理论容易证明(S,I)是一拟阵。拟阵的另一个例子是无向图G=(V,E)的图拟阵给定拟阵M=(S,I),对于I中的独立子集A I,若S有一元素x A,使得将x加入A后仍保持独立性,即Ax I,则称x为A的可扩展元素。当拟阵M中的独立子集A没有可扩展元素时,称A为极大独立子集。,60,贪心算法的理论基础,下面的关于极大独立子集的性质是很有用的。定理4.1:拟阵M中所有极大独立子集大小相同。这个

35、定理可以用反证法证明。若对拟阵M=(S,I)中的S指定权函数W,使得对于任意x S,有W(x)0,则称拟阵M为带权拟阵。依此权函数,S的任一子集A的权定义为2、关于带权拟阵的贪心算法许多可以用贪心算法求解的问题可以表示为求带权拟阵的最大权独立子集问题。,61,贪心算法的理论基础,给定带权拟阵M=(S,I),确定S的独立子集AI使得W(A)达到最大。这种使W(A)最大的独立子集A称为拟阵M的最优子集。由于S中任一元素x的权W(x)是正的,因此,最优子集也一定是极大独立子集。例如,在最小生成树问题可以表示为确定带权拟阵 的最优子集问题。求带权拟阵的最优子集A的算法可用于解最小生成树问题。下面给出求

36、带权拟阵最优子集的贪心算法。该算法以具有正权函数W的带权拟阵M=(S,I)作为输入,经计算后输出M的最优子集A。,62,贪心算法的理论基础,Set greedy (M,W) A=;将S中元素依权值W(大者优先)组成优先队列;while (S!=) S.removeMax(x);if (AxI) A=Ax;return A ,63,贪心算法的理论基础,算法greedy的计算时间复杂性为 引理4.2(拟阵的贪心选择性质)设M=(S,I)是具有权函数W的带权拟阵,且S中元素依权值从大到小排列。又设x S是S中第一个使得x是独立子集的元素,则存在S的最优子集A使得x A。算法greedy在以贪心选择构

37、造最优子集A时,首次选入集合A中的元素x是单元素独立集中具有最大权的元素。此时可能已经舍弃了S中部分元素。可以证明这些被舍弃的元素不可能用于构造最优子集。,64,贪心算法的理论基础,引理4.3:设M=(S,I)是拟阵。若S中元素x不是空集的可扩展元素,则x也不可能是S中任一独立子集A的可扩展元素。引理4.4(拟阵的最优子结构性质)设x是求带权拟阵M(S,I)的最优子集的贪心算法greedy所选择的S中的第一个元素。那么,原问题可简化为求带权拟阵M=(S,I)的最优子集问题,其中:S=y|y S且x,y II=B|B S-x且Bx IM的权函数是M的权函数在S上的限制(称M为M关于元素x的收缩)

38、。,65,贪心算法的理论基础,定理4.5(带权拟阵贪心算法的正确性)设M(S,I)是具有权函数W的带权拟阵,算法greedy返回M的最优子集。 3、任务时间表问题给定一个单位时间任务的有限集S。关于S的一个时间表用于描述S中单位时间任务的执行次序。时间表中第1个任务从时间0开始执行直至时间1结束,第2个任务从时间1开始执行至时间2结束,第n个任务从时间n-1开始执行直至时间n结束。,66,贪心算法的理论基础,具有截止时间和误时惩罚的单位时间任务时间表问题可描述如下。(1) n个单位时间任务的集合S=1,2,n;(2) 任务i的截止时间 ,1in,1 n,即要求任务i在时间 之前结束;(3) 任

39、务i的误时惩罚 ,1in,即任务i未在时间 之前结束将招致的 惩罚;若按时完成则无惩罚。任务时间表问题要求确定S的一个时间表(最优时间表)使得总误时惩罚达到最小。,67,贪心算法的理论基础,这个问题看上去很复杂,然而借助于拟阵,可以用带权拟阵的贪心算法有效求解。对于一个给定的S的时间表,在截止时间之前完成的任务称为及时任务,在截止时间之后完成的任务称为误时任务。S的任一时间表可以调整成及时优先形式,即其中所有及时任务先于误时任务,而不影响原时间表中各任务的及时或误时性质。类似地,还可将S的任一时间表调整成为规范形式,其中及时任务先于误时任务,且及时任务依其截止时间的非减序排列。,68,贪心算法

40、的理论基础,首先可将时间表调整为及时优先形式,然后再进一步调整及时任务的次序。任务时间表问题等价于确定最优时间表中及时任务子集A的问题。一旦确定了及时任务子集A,将A中各任务依其截止时间的非减序列出,然后再以任意次序列出误时任务,即S-A中各任务,由此产生S的一个规范的最优时间表。对时间t=1,2,n,设 (A)是任务子集A中所有截止时间是t或更早的任务数。考察任务子集A的独立性。,69,贪心算法的理论基础,引理4.6:对于S的任一任务子集A,下面的各命题是等价的。(1) 任务子集A是独立子集。(2) 对于t=1,2,n, (A)t。(3) 若A中任务依其截止时间非减序排列,则A中所有任务都是

41、及时的。任务时间表问题要求使总误时惩罚达到最小,这等价于使任务时间表中的及时任务的惩罚值之和达到最大。下面的定理表明可用带权拟阵的贪心算法解任务时间表问题。,70,贪心算法的理论基础,定理4.7:设S是带有截止时间的单位时间任务集,I是S的所有独立任务子集构成的集合。则有序对(S,I)是拟阵。由定理4.5可知,用带权拟阵的贪心算法可以求得最大权(惩罚)独立任务子集A,以A作为最优时间表中的及时任务子集,容易构造最优时间表。任务时间表问题的贪心算法的计算时间复杂性是 。其中f(n)是用于检测任务子集A的独立性所需的时间。用引理4.6中性质(2)容易设计一个 时间算法来检测任务子集的独立性。因此,

42、整个算法的计算时间为 。具体算法greedyJob可描述如P130。,71,贪心算法的理论基础,用抽象数据类型并查集UnionFind可对上述算法作进一步改进。如果不计预处理的时间,改进后的算法fasterJob所需的计算时间为 。,72,73,74,75,删数问题 键盘输入一个高精度的正整数N,去掉其中任意S个数字后使剩下的数最小。 例如: N=175438, S=4; 可以删去7,5,4,8,得到13。分析很容易想到用贪心,但是贪心标准是什么呢? 删S次,每次删的数要使剩下的数尽量小。例如上面的例子,第一次删7,至少比第一次删1,5,4,3,8好! 这样,删数过程是:175438 1543

43、8 1438 138 13实现很简单,就是从左向右找到第一个i,使nini+1,如果找到了,就删第i个,否则删最后一位。 这里一次选择的i是2,2,2,3,因此解向量是:(2,2,2,3),76,分析 这是一道运用贪心策略求解的典型问题。此题所需处理的数据从表面上看是一个整数。其实,大家通过对此题得深入分析便知:本题所给出的高精度正整数在具体做题时将它看作由若干个数字所组成的一串数,这是求解本题的一个重要突破。这样便建立起了贪心策略的数学描述。每次删除一个数字,选择一个使剩下的数最小的数字作为删除对象,之所以选择这样”贪心”的操作,是因为删S个数字的全局最优解包含了删一个数字的子问题的最优解.

44、,77,当S=1时,在N中删除哪一个数字能达到最小的目的?从左到右每相邻的两个数字比较:若出现左边大于右边,则删除左边的大数字.若不出现降序排列,即所有数字全部升序,则删除最右边的大数字. 当S1,按上述操作一个一个删除,删除一个达到最小后,再从头即从串首开始,删除第2个,依次分解为S次完成. 若删除不到S个后已无左边大于右边的减序,则停止删除操作,打印剩下串的左边L-S个数字即可(相当于删除了若干个最右边的大数字,这里L为原数字N的位数).,78,using namespace std; int main() string n; int s,i,x,l,m;while(cinns) i=-1

45、; m=0; x=0; l=n.length(); while(xni+1) /出现递减,删除递减的首数字 n=n.erase(i,1);x+; / x统计删除数字的个数 i=-1; /从头开始查递减区间 if(i=l-x-2 /只打印剩下的左边l-(s-x)个数字 ,79,Kruskal算法,80,81,82,83,最优乘车问题 试题描述 城是一个旅游胜地,每年都有成千上万的人前来观光为方便游客,巴士公司在各个旅游景点及宾馆、饭店等地都设置了巴士站,并开通了一些单向巴士线路。每条单向巴士线路从某个巴士站出发,依次途径若干个巴士站,最终到达终点巴士站。 某人最近到城旅游,住在CPU饭店。他很想

46、去公园游玩。听人说,从CPU饭店到公园可能有也可能没有直通巴士。如果没有,就要换乘不同线路的单向巴士,还有可能无法乘巴士到达。 现在用整数,.,给城的所有巴士站编号,约定CPU饭店的巴士站编号为,公园巴士站的编号为。 写一个程序,帮助寻找一个最优乘车方案,使他在从CPU饭店到公园的过程中换车的次数最少。,84,分析 此题看上去很像一道搜索问题。在搜索问题中,我们所求的使经过车站数最少的方案,而本题所求解的使换车次数最少的方案。这两种情况的解是否完全相同呢?我们来看一个实例:,85,如图5所示:共有个车站(分别为、), 共有条巴士线(线路:;线路:;线路:)。此时要使换车次数最少,应乘坐线路的巴

47、士,路线为:,换车次数为;要使途经车站数最少,乘坐线路应为,换车次数为。所以说使换车次数最少的路线和使途经车站数最少的方案不一定相同。这使不能用搜索发求解此问题的原因之一。 此题完全可以套用上文所提到的Dijkstra算法来求解。,86,输入数据:输入文件INPUT.TXT。文件的第1行是一个数字M(1M100)表示开通了M条单向巴士线路,第2行是一个数字N(1N500),表示共有N个车站。从第3行到第M+2行依次给出了第一条到第M条巴士线路的信息。其中第i+2行给出的是第i条巴士线路的信息,从左至右依次按行行驶顺序给出了该线路上的所有站点,相邻两个站号之间用一个空格隔开。 输出数据:输出文件是OUTPUT.TXT。文件只有一行,为最少换车次数(在0,1,M-1中取值),0表示不需换车即可达到。如果无法乘车达到S公园,则输出“NO“。,87,#include #include #include using namespace std; int m,n; /m为开通的单向巴士线路数,n为车站总数 int result502; /到某车站的最少换车数 int num50252; /从某车站可达的所有车站序列 int sum502; /从某车站可达的车站总数 bool check502; /某车站是否已扩展完 const int INF=600;,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报