1、第5章 回溯法,回溯法,有许多问题,当需要找出它的解集或者要求回答什么解是满足某些约束条件的最佳解时,往往要使用回溯法。 回溯法的基本做法是搜索,或是一种组织得井井有条的,能避免不必要搜索的穷举式搜索法。这种方法适用于解一些组合数相当大的问题。 回溯法在问题的解空间树中,按深度优先策略,从根结点出发搜索解空间树。算法搜索至解空间树的任意一点时,先判断该结点是否包含问题的解。如果肯定不包含,则跳过对该结点为根的子树的搜索,逐层向其祖先结点回溯;否则,进入该子树,继续按深度优先策略搜索。,问题的解空间,问题的解向量:回溯法希望一个问题的解能够表示成一个n元式(x1,x2,xn)的形式。 显约束:对
2、分量xi的取值限定。 隐约束:为满足问题的解而对不同分量之间施加的约束。 解空间:对于问题的一个实例,解向量满足显式约束条件的所有多元组,构成了该实例的一个解空间。,注意:同一个问题可以有多种表示,有些表示方法更简单,所需表示的状态空间更小(存储量少,搜索方法简单)。,n=3时的0-1背包问题用完全二叉树表示的解空间,生成问题状态的基本方法,扩展结点:一个正在产生儿子的结点称为扩展结点 活结点:一个自身已生成但其儿子还没有全部生成的节点称做活结点 死结点:一个所有儿子已经产生的结点称做死结点 深度优先的问题状态生成法:如果对一个扩展结点R,一旦产生了它的一个儿子C,就把C当做新的扩展结点。在完
3、成对子树C(以C为根的子树)的穷尽搜索之后,将R重新变成扩展结点,继续生成R的下一个儿子(如果存在) 宽度优先的问题状态生成法:在一个扩展结点变成死结点之前,它一直是扩展结点 回溯法:为了避免生成那些不可能产生最佳解的问题状态,要不断地利用限界函数(bounding function)来处死那些实际上不可能产生所需解的活结点,以减少问题的计算量。具有限界函数的深度优先生成法称为回溯法,回溯法的基本思想,(1)针对所给问题,定义问题的解空间; (2)确定易于搜索的解空间结构; (3)以深度优先方式搜索解空间,并在搜索过程中用剪枝函数避免无效搜索。,常用剪枝函数: 用约束函数在扩展结点处剪去不满足
4、约束的子树; 用限界函数剪去得不到最优解的子树。,用回溯法解题的一个显著特征是在搜索过程中动态产生问题的解空间。在任何时刻,算法只保存从根结点到当前扩展结点的路径。如果解空间树中从根结点到叶结点的最长路径的长度为h(n),则回溯法所需的计算空间通常为O(h(n)。而显式地存储整个解空间则需要O(2h(n)或O(h(n)!)内存空间。,递归回溯,回溯法对解空间作深度优先搜索,因此,在一般情况下用递归方法实现回溯法。 void backtrack (int t) if (tn) output(x);elsefor (int i=f(n,t);i=g(n,t);i+) xt=h(i);if (con
5、straint(t) ,迭代回溯,采用树的非递归深度优先遍历算法,可将回溯法表示为一个非递归迭代过程。 void iterativeBacktrack () int t=1;while (t0) if (f(n,t)=g(n,t) for (int i=f(n,t);i=g(n,t);i+) xt=h(i);if (constraint(t) ,子集树与排列树,遍历子集树需O(2n)计算时间,遍历排列树需要O(n!)计算时间,void backtrack (int t) if (tn) output(x);elsefor (int i=0;i=1;i+) xt=i;if (legal(t) b
6、acktrack(t+1); ,void backtrack (int t) if (tn) output(x);elsefor (int i=t;i=n;i+) swap(xt, xi);if (legal(t) backtrack(t+1);swap(xt, xi); ,0-1背包问题,给定n种物品和一背包。物品i的重量是wi,其价值为vi,背包的容量为C。问应如何选择装入背包的物品,使得装入背包中物品的总价值最大? 0-1背包问题是一个特殊的整数规划问题。,01背包问题:n=3,w=20,30,10,p=100,120,60且C=50.,三个对象的背包问题的解空间 1 01 0 1 01
7、 0 1 0 1 0 1 0,A,B,G,I,F,H,E,L,D,C,回溯法解决01背包问题,1.解向量:一维数组 2.约束:取值范围,重量限制 3.解空间:子集树 4.代码实现 5.改进,0-1背包问题,解空间:子集树 可行性约束函数: 上界函数:,private static double bound(int i)/ 计算上界double cleft = c - cw; / 剩余容量double bound = cp;/ 以物品单位重量价值递减序装入物品while (i = n ,装载问题,有一批共n个集装箱要装上2艘载重量分别为c1和c2的轮船,其中集装箱i的重量为wi,且,装载问题要求
8、确定是否有一个合理的装载方案可将这个集装箱装上这2艘轮船。如果有,找出一种装载方案。 容易证明,如果一个给定装载问题有解,则采用下面的策略可得到最优装载方案。 (1)首先将第一艘轮船尽可能装满; (2)将剩余的集装箱装上第二艘轮船。 将第一艘轮船尽可能装满等价于选取全体集装箱的一个子集,使该子集中集装箱重量之和最接近。由此可知,装载问题等价于以下特殊的0-1背包问题。,用回溯法设计解装载问题的O(2n)计算时间算法。在某些情况下该算法优于动态规划算法。,装载问题,解空间:子集树 可行性约束函数(选择当前元素): 上界函数(不选择当前元素): 当前载重量cw+剩余集装箱的重量r当前最优载重量be
9、stw,private static void backtrack (int i)/ 搜索第i层结点if (i n) / 到达叶结点更新最优解bestx,bestw;return;r -= wi;if (cw + wi bestw) xi = 0; / 搜索右子树backtrack(i + 1); r += wi;,批处理作业调度,给定n个作业的集合J1,J2,Jn。每个作业必须先由机器1处理,然后由机器2处理。作业Ji需要机器j的处理时间为tji。对于一个确定的作业调度,设Fji是作业i在机器j上完成处理的时间。所有作业在机器2上完成处理的时间和称为该作业调度的完成时间和。 批处理作业调度问
10、题要求对于给定的n个作业,制定最佳作业调度方案,使其完成时间和达到最小。,这3个作业的6种可能的调度方案是1,2,3;1,3,2;2,1,3;2,3,1;3,1,2;3,2,1;它们所相应的完成时间和分别是19,18,20,21,19,19。易见,最佳调度方案是1,3,2,其完成时间和为18。,批处理作业调度,解空间:排列树,private static void backtrack(int i)if (i n) for (int j = 1; j f1)?f2i-1:f1)+mxj2;f+=f2i;if (f bestf) MyMath.swap(x,i,j);backtrack(i+1);
11、MyMath.swap(x,i,j);f1-=mxj1;f-=f2i;,public class FlowShopstatic int n, / 作业数f1, / 机器1完成处理时间f, / 完成时间和bestf; / 当前最优值static int m; / 各作业所需的处理时间static int x; / 当前作业调度static int bestx; / 当前最优作业调度static int f2; / 机器2完成处理时间,符号三角形问题,+ + - + - + + + - - - - + - + + + - + + - + - -+,下图是由14个“+”和14个“-”组成的符号三角形
12、。2个同号下面都是“+”,2个异号下面都是“-”。,在一般情况下,符号三角形的第一行有n个符号。符号三角形问题要求对于给定的n,计算有多少个不同的符号三角形,使其所含的“+”和“-”的个数相同。,符号三角形问题,解向量:用n元组x1:n表示符号三角形的第一行。 可行性约束函数:当前符号三角形所包含的“+”个数与“-”个数均不超过n*(n+1)/4 无解的判断:n*(n+1)/2为奇数,private static void backtrack (int t)if (counthalf)|(t*(t-1)/2-counthalf) return;if (tn) sum+;else for (in
13、t i=0;i2;i+) p1t=i;count+=i;for (int j=2;j=t;j+) pjt-j+1=pj-1t-j+1pj-1t-j+2;count+=pjt-j+1;backtrack(t+1);for (int j=2;j=t;j+) count-=pjt-j+1;count-=i;,+ + - + - + + + - - - - + - + + + - + + - + - -+,复杂度分析 计算可行性约束需要O(n)时间,在最坏情况下有 O(2n)个结点需要计算可行性约束,故解符号三角形问题的回溯算法所需的计算时间为 O(n2n)。,n后问题,在nn格的棋盘上放置彼此不受攻
14、击的n个皇后。按照国际象棋的规则,皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。n后问题等价于在nn格的棋盘上放置n个皇后,任何2个皇后不放在同一行或同一列或同一斜线上。,解向量:(x1, x2, , xn) 显约束:xi=1,2, ,n 隐约束:1)不同列:xixj2)不处于同一正、反对角线:|i-j|xi-xj|,n后问题,private static boolean place (int k)for (int j=1;jn) sum+;elsefor (int i=1;i=n;i+) xt=i;if (place(t) backtrack(t+1);,22,【问题】 填字游戏,问
15、题描述:在33个方格的方阵中要填入数字1到N(N10)内的某9个数字,每个方格填一个整数,使得所有相邻两个方格内的两个整数之和为质数。试求出所有满足这个要求的各种数字填法。,1 2 34 9 815 14 5请按任意键继续. . .1 2 34 9 1415 8 5请按任意键继续. . .1 2 34 15 89 14 5请按任意键继续. . .1 2 34 15 149 8 5,请按任意键继续. . .1 2 36 5 87 12 11请按任意键继续. . .1 2 36 5 1411 8 9请按任意键继续. . .1 2 36 5 1411 8 15请按任意键继续. . .,24,练习:走
16、台阶问题,【题目叙述】你眼前一共有n级台阶(n为正整数),现在你要走完这n级台阶,已知你只能一步走一级或一步走两级,请你算算一共有多少种走法,并把这些走法都给出。 【输入输出样例】输入:3 输出:1 1 1 1 2 2 1,找数 【题目叙述】键盘输入n个正整数(互不相等),找出其中和等于m的数的组合。 【输入输出样例】输入:5(m的值) 1 2 3 4 5 输出:1 4 2 3 5,25,液晶数字问题,【题目叙述】 如下图所示:09这10个数字可以由下列7个发光二极管组成。0-9十个数字排成一排,每个数字只可以用一次。排列要求:相邻数字后一个是由前一个数字添上几笔或是减去几笔得到的,不允许同时
17、加减。例如:3和8,8和3可以相邻,3和5不能相邻等。问:有多少符合要求的排列?给出所有排列方法。,26,最大团问题,给定无向图G=(V,E)。如果UV,且对任意u,vU有(u,v)E,则称U是G的完全子图。G的完全子图U是G的团当且仅当U不包含在G的更大的完全子图中。G的最大团是指G中所含顶点数最多的团。 如果UV且对任意u,vU有(u,v)E,则称U是G的空子图。G的空子图U是G的独立集当且仅当U不包含在G的更大的空子图中。G的最大独立集是G中所含顶点数最多的独立集。 对于任一无向图G=(V,E)其补图G=(V1,E1)定义为:V1=V,且(u,v)E1当且仅当(u,v)E。,U是G的最大
18、团当且仅当U是G的最大独立集。,最大团问题(Maximum Clique Problem, MCP),是图论中一个经典的组合优化问题,也是一类NP完全问题,在国际上已有广泛的研究,而国内对MCP问题的研究则还处于起步阶段,因此,研究最大团问题具有较高的理论价值和现实意义。 MCP问题是现实世界中一类真实问题,在市场分析、方案选择、信号传输、计算机视觉、故障诊断等领域具有非常广泛的应用确定性算法:回溯法、分支限界法等, 启发式算法:如顺序贪婪启发式算法、遗传算法、模拟退火算法、禁忌搜索算法、神经网络算法等,29,程序思路,首先设最大团为一个空团,往其中加入一个顶 点,然后依次考虑每个顶点,查看该
19、顶点加入 团之后仍然构成一个团,如果可以,考虑将该 顶点加入团或者舍弃两种情况,如果不行,直 接舍弃,然后递归判断下一顶点。 对于无连接或者直接舍弃两种情况,在递归 前,可采用剪枝策略来避免无效搜索,30,判断顶点是否可入团,为了判断当前顶点加入团之后是否仍是一个 团,只需要考虑该顶点和团中顶点是否都有连 接。代码如下: for(j=1;ji;j+)if(xj,31,剪枝策略,程序中采用了一个比较简单的剪枝策略,即如 果剩余未考虑的顶点数加上团中顶点数不大于 当前解的顶点数,可停止继续深度搜索,否则继续深 度递归,程序代码如下: if(cn+n-ibestn)xi=0;/设置标志 backtr
20、ack(i+1);/递归判断下一顶点 ,32,递归结束条件,当搜索到一个叶结点时,即可停止搜索,此时 更新最优解和最优值,程序代码如下: if(in)for(j=1;j=n;j+)bestxj=xj;bestn=cn;return;,最大团问题,解空间:子集树 可行性约束函数:顶点i到已选入的顶点集中每一个顶点都有边相连。 上界函数:有足够多的可选择顶点使得算法有可能在右子树中找到更大的团。,private static void backtrack(int i)if (i n) / 到达叶结点for (int j = 1; j bestn) / 进入右子树xi = 0;backtrack(i
21、 + 1); ,复杂度分析 最大团问题的回溯算法backtrack所需的计算时间显然为O(n2n)。,进一步改进算法的建议,选择合适的搜索顺序,可以使得上界函数更有效的发挥作用。例如在搜索之前可以将顶点按度从小到大排序。这在某种意义上相当于给回溯法加入了启发性。 定义Si=vi,vi+1,.,vn,依次求出Sn,Sn-1,.,S1的解。从而得到一个更精确的上界函数,若cn+Si=max则剪枝。同时注意到:从Si+1到Si,如果找到一个更大的团,那么vi必然属于找到的团,此时有Si=Si+1+1,否则Si=Si+1。因此只要max的值被更新过,就可以确定已经找到最大值,不必再往下搜索了。,图的m
22、着色问题,给定无向连通图G和m种不同的颜色。用这些颜色为图G的各顶点着色,每个顶点着一种颜色。是否有一种着色法使G中每条边的2个顶点着不同颜色。这个问题是图的m可着色判定问题。若一个图最少需要m种颜色才能使图中每条边连接的2个顶点着不同颜色,则称这个数m为该图的色数。求一个图的色数m的问题称为图的m可着色优化问题。,解向量:(x1, x2, , xn)表示顶点i所着颜色xi 可行性约束函数:顶点i与已着色的相邻顶点颜色不重复。,图的m着色问题,private static void backtrack(int t)if (tn) sum+;elsefor (int i=1;i=m;i+) xt
23、=i;if (ok(t) backtrack(t+1);private static boolean ok(int k)/ 检查颜色可用性for (int j=1;j=n;j+)if (akj ,复杂度分析 图m可着色问题的解空间树中内结点个数是 对于每一个内结点,在最坏情况下,用ok检查当前扩展结点的每一个儿子所相应的颜色可用性需耗时O(mn)。因此,回溯法总的时间耗费是,旅行售货员问题,旅行商问题,即TSP问题(Travelling Salesman Problem)又译为旅行推销员问题、货郎担问题,是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路径的
24、限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。,旅行售货员问题,1,2,4,3,35,25,12,10,20,15,1,3,2,4,1的开销为85并不是最优解。 1,2,4,3,1的开销为72,旅行售货员问题,旅行售货员问题,TSP问题是一个NPC问题。Non-deterministic Polynomial complete problem 应用领域包括:如何规划最合理高效的道路交通,以减少拥堵;如何更好地规划物流,以减少运营成本;在互联网环境中如何更好地设置节点,以更好地让信息流动等 。 2010年10月25日,英国一项最
25、新研究说,在花丛中飞来飞去的小蜜蜂显示出了轻易破解“旅行商问题”的能力,旅行售货员问题,解空间:排列树,private static void backtrack(int i)if (i = n) if (axn - 1xn Float.MAX_VALUE ,复杂度分析 算法backtrack在最坏情况下可能需要更新当前最优解O(n-1)!)次,每次更新bestx需计算时间O(n),从而整个算法的计算时间复杂性为O(n!)。,圆排列问题,给定n个大小不等的圆c1,c2,cn,现要将这n个圆排进一个矩形框中,且要求各圆与矩形框的底边相切。圆排列问题要求从n个圆的所有排列中找出有最小长度的圆排列。
26、例如,当n=3,且所给的3个圆的半径分别为1,1,2时,这3个圆的最小长度的圆排列如图所示。其最小长度为,圆排列问题,private static float center(int t)/ 计算当前所选择圆的圆心横坐标float temp=0;for (int j=1;jtemp) temp=valuex;return temp;,private static void compute()/ 计算当前圆排列的长度float low=0,high=0;for (int i=1;ihigh) high=xi+ri;if (high-lowmin) min=high-low;,private sta
27、tic void backtrack(int t)if (tn) compute();elsefor (int j = t; j = n; j+) MyMath.swap(r, t, j);float centerx=center(t);if (centerx+rt+r1min) /下界约束xt=centerx;backtrack(t+1);MyMath.swap(r, t, j);,复杂度分析 由于算法backtrack在最坏情况下可能需要计算O(n!)次当前圆排列长度,每次计算需O(n)计算时间,从而整个算法的计算时间复杂性为O(n+1)!),上述算法尚有许多改进的余地。例如,象1,2,n
28、-1,n和n,n-1, ,2,1这种互为镜像的排列具有相同的圆排列长度,只计算一个就够了,可减少约一半的计算量。另一方面,如果所给的n个圆中有k个圆有相同的半径,则这k个圆产生的k!个完全相同的圆排列,只计算一个就够了。,连续邮资问题,假设国家发行了n种不同面值的邮票,并且规定每张信封上最多只允许贴m张邮票。连续邮资问题要求对于给定的n和m的值,给出邮票面值的最佳设计,在1张信封上可贴出从邮资1开始,增量为1的最大连续邮资区间。,例如,当n=5和m=4时,面值为(1,3,11,15,32)的5种邮票可以贴出邮资的最大连续邮资区间是1到70。,连续邮资问题,解向量:用n元组x1:n表示n种不同的
29、邮票面值,并约定它们从小到大排列。x1=1是惟一的选择。 可行性约束函数:已选定x1:i-1,最大连续邮资区间是1:r,接下来xi的可取值范围是xi-1+1:r+1。,如何确定r的值? 计算X1:i的最大连续邮资区间在本算法中被频繁使用到,因此势必要找到一个高效的方法。考虑到直接递归的求解复杂度太高,我们不妨尝试计算用不超过m张面值为x1:i的邮票贴出邮资k所需的最少邮票数yk。通过yk可以很快推出r的值。事实上,yk可以通过递推在O(n)时间内解决: for (int j=0; j= xi-2*(m-1);j+)if (yjm)for (int k=1;k=m-yj;k+)if (yj+ky
30、j+xi-1*k) yj+xi-1*k=yj+k;while (yrmaxint) r+;,回溯法效率分析,通过前面具体实例的讨论容易看出,回溯算法的效率在很大程度上依赖于以下因素: (1)产生xk的时间; (2)满足显约束的xk值的个数; (3)计算约束函数constraint的时间; (4)计算上界函数bound的时间; (5)满足约束函数和上界函数约束的所有xk的个数。 好的约束函数能显著地减少所生成的结点数。但这样的约束函数往往计算量较大。因此,在选择约束函数时通常存在生成结点数与约束函数计算量之间的折衷。,重排原理,对于许多问题而言,在搜索试探时选取xi的值顺序是任意的。在其他条件相当的前提下,让可取值最少的xi优先。从图中关于同一问题的2棵不同解空间树,可以体会到这种策略的潜力。,图(a)中,从第1层剪去1棵子树,则从所有应当考虑的3元组中一次消去12个3元组。对于图(b),虽然同样从第1层剪去1棵子树,却只从应当考虑的3元组中消去8个3元组。前者的效果明显比后者好。,(a),(b),课堂练习,问题: 给定n个正整数wi和一个正整数m,在这n个正整数中找出一个子集,使得子集中的正整数之和等于m。,