1、第2章 递归与分治策略,2.1 递归的概念,直接或间接地调用自身的算法称为递归算法。 用函数自身给出定义的函数称为递归函数。,下面来看几个实例。,2.1 递归的概念,例1 阶乘函数 阶乘函数可递归地定义为:,边界条件,递归方程,边界条件与递归方程是递归函数的二个要素,递归函数只有具备了这两个要素,才能在有限次计算后得出结果。,2.1 递归的概念,例2 Fibonacci数列无穷数列1,1,2,3,5,8,13,21,34,55,被称为Fibonacci数列。它可以递归地定义为:,边界条件,递归方程,第n个Fibonacci数可递归地计算如下: int fibonacci(int n)if (n
2、 = 1) return 1;return fibonacci(n-1)+fibonacci(n-2);,2.1 递归的概念,例3 Ackerman函数 当一个函数及它的一个变量是由函数自身定义时,称这个函数是双递归函数。 Ackerman函数A(n,m)定义如下:,2.1 递归的概念,例3 Ackerman函数 前2例中的函数都可以找到相应的非递归方式定义:,但本例中的Ackerman函数却无法找到非递归的定义。,2.1 递归的概念,例3 Ackerman函数 A(n,m)的自变量m的每一个值都定义了一个单变量函数: M=0时,A(n,0)=n+2 M=1时,A(n,1)=A(A(n-1,1
3、),0)=A(n-1,1)+2,和A(1,1)=2故A(n,1)=2*n M=2时,A(n,2)=A(A(n-1,2),1)=2A(n-1,2),和A(1,2)=A(A(0,2),1)=A(1,1)=2,故A(n,2)= 2n 。M=3时,类似的可以推出 M=4时,A(n,4)的增长速度非常快,以至于没有适当的数学式子来表示这一函数。,2.1 递归的概念,例3 Ackerman函数 定义单变量的Ackerman函数A(n)为,A(n)=A(n,n)。 定义其拟逆函数(n)为:(n)=minkA(k)n。即(n)是使nA(k)成立的最小的k值。 (n)在复杂度分析中常遇到。对于通常所见到的正整数
4、n,有(n)4。但在理论上(n)没有上界,随着n的增加,它以难以想象的慢速度趋向正无穷大。,2.1 递归的概念,例4 排列问题 设计一个递归算法生成n个元素r1,r2,rn的全排列。,设R=r1,r2,rn是要进行排列的n个元素,Ri=R-ri。 集合X中元素的全排列记为perm(X)。 (ri)perm(X)表示在全排列perm(X)的每一个排列前加上前缀得到的排列。R的全排列可归纳定义如下:,当n=1时,perm(R)=(r),其中r是集合R中唯一的元素; 当n1时,perm(R)由(r1)perm(R1),(r2)perm(R2),(rn)perm(Rn)构成。,void perm(ch
5、ar list, int k, int m) /产生k-m的所有排列if (k = m) for (int i = 0; i m; i +) printf(listi);printf(“ “); else for (int i = k; i m; i +) swap(listk,listi);perm(list, k+1, m);swap(listk,listi);,2.1 递归的概念,例5 整数划分问题 将正整数n表示成一系列正整数之和:n=n1+n2+nk, 其中n1n2nk1,k1。 正整数n的这种表示称为正整数n的划分。求正整数n的不 同划分个数。 例如正整数6有如下11种不同的划分:
6、6;5+1;4+2,4+1+1;3+3,3+2+1,3+1+1+1;2+2+2,2+2+1+1,2+1+1+1+1;1+1+1+1+1+1。,(2) q(n,m)=q(n,n),mn; 最大加数n1实际上不能大于n。因此,q(1,m)=1。,(1) q(n,1)=1,n1; 当最大加数n1不大于1时,任何正整数n只有一种划分形式, 即,(4) q(n,m)=q(n,m-1)+q(n-m,m),nm1; 正整数n的最大加数n1不大于m的划分由n1=m的划分和 n1m-1 的划分组成。,(1)q(n,1)=1; (2)q(n,m)=q(n,n),mn; (3) q(n,n)=1+q(n,n-1);
7、 正整数n的划分由n1=n的划分和n1n-1的划分组成。,2.1 递归的概念,例5 整数划分问题 前面的几个例子中,问题本身都具有比较明显的递归关系,因而容易用递归函数直接求解。 在本例中,如果设p(n)为正整数n的划分数,则难以找到递归关系,因此考虑增加一个自变量:将最大加数n1不大于m的划分个数记作q(n,m)。可以建立q(n,m)的如下递归关系。,2.1 递归的概念,例5 整数划分问题 前面的几个例子中,问题本身都具有比较明显的递归关系,因而容易用递归函数直接求解。 在本例中,如果设p(n)为正整数n的划分数,则难以找到递归关系,因此考虑增加一个自变量:将最大加数n1不大于m的划分个数记
8、作q(n,m)。可以建立q(n,m)的如下递归关系。,正整数n的划分数p(n)=q(n,n)。,int q(int n,int m) if (n1)|(m1) return 0;if (n= =1)|(m= =1) return 1;if(nm) return q(n,n);if (n= =m) return q(n,m-1)+1;return q(n,m-1)+q(n-m,m); ,整数划分问题递归程序,2.1 递归的概念,例6 Hanoi塔问题设a,b,c是3个塔座。开始时,在塔座a上有一叠共n个圆盘,这些圆盘自下而上,由大到小地叠在一起。各圆盘从小到大编号为1,2,n,现要求将塔座a上的
9、这一叠圆盘移到塔座b上,并仍按同样顺序叠置。在移动圆盘时应遵守以下移动规则: 规则1:每次只能移动1个圆盘; 规则2:任何时刻都不允许将较大的圆盘压在较小的圆盘之上; 规则3:在满足移动规则1和2的前提下,可将圆盘移至a,b,c中任 一塔座上。 动画演示,在问题规模较大时,较难找到一般的方法,因此我们尝试用递归技术来解决这个问题。,当n=1时,问题比较简单。此时,只要将编号为1的圆盘从塔座a直接移至塔座b上即可。 当n1时,需要利用塔座c作为辅助塔座。此时若能设法将n-1个较小的圆盘依照移动规则从塔座a移至塔座c,然后,将剩下的最大圆盘从塔座a移至塔座b,最后,再设法将n-1个较小的圆盘依照移
10、动规则从塔座c移至塔座b。 由此可见,n个圆盘的移动问题可分为2次n-1个圆盘的移动问题,这又可以递归地用上述方法来做。由此可以设计出解Hanoi塔问题的递归算法如下。,2.1 递归的概念,例6 Hanoi塔问题,void hanoi(int n, int a, int b, int c)if (n 0)hanoi(n-1, a, c, b);move(a,b);hanoi(n-1, c, b, a);,思考题:如果塔的个数变为a,b,c,d四个,现要将n个圆盘从a全部移动到d,移动规则不变,求移动步数最小的方案。,递归小结,优点:结构清晰,可读性强,而且容易用数学归纳法来证明算法的正确性,因
11、此它为设计算法、调试程序带来很大方便。缺点:递归算法的运行效率较低,无论是耗费的计算时间还是占用的存储空间都比非递归算法要多。,递归小结,解决方法:在递归算法中消除递归调用,使其转化为非递归算法。 1.采用一个用户定义的栈来模拟系统的递归调用工作栈。该方法通用性强,但本质上还是递归,只不过人工做了本来由编译器做的事情,优化效果不明显。 2.用递推来实现递归函数。 3.通过Cooper变换、反演变换能将一些递归转化为尾递归,从而迭代求出结果。后两种方法在时空复杂度上均有较大改善,但其适用范围有限。,任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。 问题的规模越小,越容易直接求解,解题
12、所需的计算时间也越少。 例如,对于n个元素的排序问题, n=1时,不需任何计算。 n=2时, 只要作一次比较即可排好序。 n=3时 只要作3次比较即可,。 而当n较大时,问题就不那么容易处理了。要想直接解决一个规模较大的问题,有时是相当困难的。 分治法的设计思想是,将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。,将要求解的较大规模的问题分割成k个更小规模的子问题。,算法总体思想,n,T(n/4),T(n/4),T(n/4),T(n/4),T(n),=,算法总体思想,对这k个子问题分别求解。如果子问题的规模仍然不够小,则再划分为k个子问题,如此递归的进行下去,
13、直到问题规模足够小,很容易求出其解为止。,n,T(n),=,算法总体思想,将求出的小规模的问题的解合并为一个更大规模的问题的解,自底向上逐步求出原来问题的解。,n,T(n),=,分治策略的定义,分治策略是:对于一个规模为n的问题,若该问题可以容易地解决(比如说规模n较小)则直接解决,否则将其分解为k个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。,如果原问题可分割成k个子问题,1kn ,且这些子问题都可解,并可利用这些子问题的解求出原问题的解,那么这种分治法就是可行的。 由分治法产生的子问题往往是原
14、问题的较小模式,这就为使用递归技术提供了方便。在这种情况下,反复应用分治手段,可以使子问题与原问题类型一致而其规模却不断缩小,最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。 分治与递归像一对孪生兄弟,经常同时应用在算法设计之中,并由此产生许多高效算法。,分治法的适用条件,分治法所能解决的问题一般具有以下几个特征: 该问题的规模缩小到一定的程度就可以容易地解决; 该问题可以分解为若干个规模较小的相同问题,即该问题具有最优子结构性质 利用该问题分解出的子问题的解可以合并为该问题的解; 该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子问题。,因为问题的计算复杂性一
15、般是随着问题规模的增加而增加,因此大部分问题满足这个特征。,这条特征是应用分治法的前提,它也是大多数问题可以满足的,此特征反映了递归思想的应用,能否利用分治法完全取决于问题是否具有这条特征,如果具备了前两条特征,而不具备第三条特征,则可以考虑贪心算法或动态规划。,这条特征涉及到分治法的效率,如果各子问题是不独立的,则分治法要做许多不必要的工作,重复地解公共的子问题,此时虽然也可用分治法,但一般用动态规划较好。,分治法解题的步骤,分治法在每一层递归上都有三个步骤:分解:将原问题分解为若干个规模较小,相互独立,与原问题形式相同的子问题; 解决:若子问题规模较小而容易被解决则直接解,否则递归地解各个
16、子问题; 合并:将各个子问题的解合并为原问题的解。,分治法一般的算法设计模式,Divide-and-Conquer(P) 1. if |P|n0 2. then return(ADHOC(P) /直接求解P 3. 将P分解为较小的子问题 P1 ,P2 ,.,Pk 4. for i1 to k 5. do yi Divide-and-Conquer(Pi) 递归解决Pi 6. T MERGE(y1,y2,.,yk) 合并子问题 7. return(T),问题,根据分治法的分割原则,原问题应该分为多少个子问题才较适宜?各个子问题的规模应该怎样才为适当?,这些问题很难予以肯定的回答。但人们从大量实践
17、中发现,在用分治法设计算法时,最好使子问题的规模大致相同。换句话说,将一个问题分成大小相等的k个子问题的处理方法是行之有效的。许多问题可以取k=2。这种使子问题规模大致相等的做法是出自一种平衡(balancing)子问题的思想,它几乎总是比子问题规模不等的做法要好。,典型例题-二分查找,对线性表的操作:查找某一个元素在线性表中的位置。 输入:是待查元素x和线性表L 输出:x在L中的位置或者x不在L中的信息。想法一:逐一扫描L的所有元素,直到找到x为止。最坏情况下需要n次比较。一种简单的情况:假设该线性表已经排好序了,不妨设它按照主键的递增顺序排列(即由小到大排列)。在这种情况下,我们是否有改进
18、查找效率的可能呢?,如果线性表里只有一个元素,则只要比较这个元素和x就可以确定x是否在线性表中。因此这个问题满足分治法的第一个适用条件; 同时我们注意到对于排好序的线性表L有以下性质:比较x和L中任意一个元素Li, 若x=Li,则x在L中的位置就是i; 如果xLi,同理我们只要在Li的后面查找x即可。 无论是在Li的前面还是后面查找x,其方法都和在L中查找x一样,只不过是线性表的规模缩小了。这就说明了此问题满足分治法的第二个和第三个适用条件。很显然此问题分解出的子问题相互独立,即在Li的前面或后面查找x是独立的子问题,因此满足分治法的第四个适用条件。,二分搜索技术,给定已按升序排好序的n个元素
19、a0:n-1,现要在这n个元素中找出一特定元素x。动画演示,据此容易设计出二分搜索算法: int binarySearch(int a, int x, int n)/ 在 a0 amiddle) left = middle + 1;else right = middle - 1;return -1; / 未找到x,算法复杂度分析: 每执行一次算法的while循环, 待搜索数组的大小减少一半。因此,在最坏情况下,while循环被执行了O(logn) 次。循环体内运算需要O(1) 时间,因此整个算法在最坏情况下的计算时间复杂性为O(logn) 。,思考题:给定a,用二分法设计出求an的算法。,典型
20、例题归并排序,基本思想:将待排序元素分成大小大致相同的2个子集合,分别对2个子集合进行排序,最终将排好序的子集合合并成为所要求的排好序的集合。,void mergeSort(type a, int left, int right)if (leftright) /至少有2个元素int i=(left+right)/2; /取中点mergeSort(a, left, i);mergeSort(a, i+1, right);merge(a, b, left, i, right); /合并到数组bcopy(a, b, left, right); /复制回数组a,复杂度分析T(n)=O(nlogn) 渐
21、进意义下的最优算法,合并排序,算法mergeSort的递归过程可以消去。,合并排序,最坏时间复杂度:O(nlogn) 平均时间复杂度:O(nlogn) 辅助空间:O(n) 稳定性:稳定,典型例题-快速排序,快速排序的基本思想是基于分治法的。 对于输入的子序列Lpr,如果规模足够小则直接进行排序,否则分三步处理: 分解(Divide):将输入的序列Lpr划分成两个非空子序列Lpq-1、L(q)和Lq+1r,使Lpq-1中任一元素的值不大于Lq+1r中任一元素的值。 递归求解(Conquer):通过递归调用快速排序算法分别对Lpq-1和Lq+1r进行排序。 合并(Merge):由于对分解出的两个子
22、序列的排序是就地进行的,所以在Lpq-1和Lq+1r都排好序后不需要执行任何计算Lpr就已排好序。,快速排序算法 void qSort(int p, int r) if (pr)int q=partition(p,r);qSort(p,q-1);qSort(q+1,r); 其中: partition(p,r)用于确定基准元素q,int partition(int a,int p,int r) int i=p,j=r+1;int x=ap;while (true)while (a+i x);if (i=j) break;swap(ai,aj);ap=aj;aj=x;return j; ,一趟快速
23、排序,快速排序的时间代价,最佳情况: 每个轴值都将数组分成相等的两个部分 最差情况:轴值未能很好分割数据,即一个数组中没有结点,另一个数组中有n-1个结点. 平均情况:在每一次分割时,轴值处于最终排好序的数组中位置的概率是一样的。T(n) = n + 1 + 1/(n-1) (T(k) + T(n-k)T(0)=T(1)=C,k=1,n-1,int randomizedPartition ( Type a, int p, int r)int i = random(p,r);swap(ai, ap);return partition (a, p, r);,快速排序,快速排序算法的性能取决于划分的
24、对称性。通过修改算法partition,可以设计出采用随机选择策略的快速排序算法。在快速排序算法的每一步中,当数组还没有被划分时,可以在ap:r中随机选出一个元素作为划分基准,这样可以使划分基准的选择是随机的,从而可以期望划分是较对称的。,最坏时间复杂度:O(n2) 平均时间复杂度:O(nlogn) 辅助空间:O(n)或O(logn) 稳定性:不稳定,大整数乘法,设X和Y都是n位的二进制整数,现在要计算它们的乘积XY。我们可以用小学所学的方法来设计一个计算乘积XY的算法,但是这样做计算步骤太多,显得效率较低。如果将每2个1位数的乘法或加法看作一步运算,那么这种方法要作O(n2)步运算才能求出乘
25、积XY。下面我们用分治法来设计一个更有效的大整数乘积算法。,我们将n位的二进制整数X和Y各分为2段,每段的长为n/2位(为简单起见,假设n是2的幂),如图6-3所示。 由此,X=A2n/2+B ,Y=C2n/2+D。这样,X和Y的乘积为: XY=(A2n/2+B)(C2n/2+D)=AC2n+(AD+CB)2n/2+BD (1) 如果按式(1)计算XY,则我们必须进行4次n/2位整数的乘法(AC,AD,BC和BD), 以及3次不超过n位的整数加法(分别对应于式(1)中的加号),此外还要做2次移位(分别对应于式(1)中乘2n和乘2n/2)。所有这些加法和移位共用O(n)步运算。设T(n)是2个n
26、位整数相乘所需的运算总数,则由式(1),我们有:,由此可得T(n)=O(n2)。因此,用(1)式来计算X和Y的乘积并不比小学生的方法更有效。要想改进算法的计算复杂性,必须减少乘法次数。为此我们把XY写成另一种形式: XY=AC2n+(A-B)(D-C)+AC+BD2n/2+BD (3) 虽然,式(3)看起来比式(1)复杂些,但它仅需做3次n/2位整数的乘法(AC,BD和(A-B)(D-C),6次加、减法和2次移位。由此可得:(4) 用解递归方程的套用公式法马上可得其解为T(n)=O(nlog3)=O(n1.59)。利用式(3),并考虑到X和Y的符号对结果的影响,我们给出大整数相乘的完整算法MU
27、LT如下:,Type MULT(X,Y,n); X和Y为2个小于2n的整数,返回结果为X和Y的乘积XY S:=SIGN(X)*SIGN(Y); S为X和Y的符号乘积 X:=ABS(X); Y:=ABS(Y); X和Y分别取绝对值 if (n=1) if (X=1 ,Strassen矩阵乘法,要做8次数乘。1969年strassen提出了只做7次数乘的算法,很有启发性。,设,P, Q, R, S, T各用2次,U, V各用1次。 时间复杂度:,空间复杂度: 2个N阶方阵,加一行N个存储单元 A的第一行与B的各列做内积之后不必保存,可以用来存C的第一行,故需要个单元,void STRASSEN(n
28、,A,B,C); if (n=2) MATRIX-MULTIPLY(A,B,C); else 将矩阵A和B分块; STRASSEN(n/2,A11,B12-B22,M1); STRASSEN(n/2,A11+A12,B22,M2); STRASSEN(n/2,A21+A22,B11,M3); STRASSEN(n/2,A22,B21-B11,M4); STRASSEN(n/2,A11+A22,B11+B22,M5); STRASSEN(n/2,A12-A22,B21+B22,M6); STRASSEN(n/2,A11-A21,B11+B12,M7);,;, ,线性时间选择,给定线性序集中n个元
29、素和一个整数k,1kn,要求找出这n个元素中第k小的元素,Type randomizedSelect(type a,int p,int r,int k)if (p=r) return ap;int i=randomizedpartition(a,p,r),j=i-p+1;if (k=j) return randomizedSelect(a,p,i,k);else return randomizedSelect(a,i+1,r,k-j);,在最坏情况下,算法randomizedSelect需要O(n2)计算时间 但可以证明,算法randomizedSelect可以在O(n)平均时间内找出n个输入
30、元素中的第k小元素。,线性时间选择,如果能在线性时间内找到一个划分基准,使得按这个基准所划分出的2个子数组的长度都至少为原数组长度的倍(01是某个正常数),那么就可以在最坏情况下用O(n)时间完成选择任务。,例如,若=9/10,算法递归调用所产生的子数组的长度至少缩短1/10。所以,在最坏情况下,算法所需的计算时间T(n)满足递归式T(n)T(9n/10)+O(n) 。由此可得T(n)=O(n)。,将n个输入元素划分成n/5个组,每组5个元素,只可能有一个组不是5个元素。用任意一种排序算法,将每组中的元素排好序,并取出每组的中位数,共n/5个。 递归调用select来找出这n/5个元素的中位数
31、。如果n/5是偶数,就找它的2个中位数中较大的一个。以这个元素作为划分基准。,线性时间选择,设所有元素互不相同。在这种情况下,找出的基准x至少比3(n-5)/10个元素大,因为在每一组中有2个元素小于本组的中位数,而n/5个中位数中又有(n-5)/10个小于基准x。同理,基准x也至少比3(n-5)/10个元素小。而当n75时,3(n-5)/10n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。,Type select (Type a,int p, int r, int k)/找第k小的数if (r-p5) /用某个简单排序算法对数组ap:r排序;bubbleSort(p,r);re
32、turn ap+k-1; /返回第k小的数/将ap+5*i至ap+5*i+4的第3小元素/与ap+i交换位置;/找中位数的中位数,r-p-4即上面所说的n-5for ( int i = 0; i=(r-p-4)/5; i+ )int s=p+5*i,t=s+4;for (int j=0;j3;j+) bubble(s,t-j);swap(a, p+i, s+2);Type x = select(a,p, p+(r-p-4)/5, (r-p+6)/10);int i=partition(a,p,r,x),j=i-p+1;if (k=j) return select(a,p,i,k);else r
33、eturn select(a,i+1,r,k-j);,复杂度分析T(n)=O(n),上述算法将每一组的大小定为5,并选取75作为是否作递归调用的分界点。这2点保证了T(n)的递归式中2个自变量之和n/5+3n/4=19n/20=n,01。这是使T(n)=O(n)的关键之处。当然,除了5和75之外,还有其他选择。,棋盘覆盖,在一个2k2k 个方格组成的棋盘中,恰有一个方格与其他方格不同,称该方格为一特殊方格,且称该棋盘为一特殊棋盘。在棋盘覆盖问题中,要用图示的4种不同形态的L型骨牌覆盖给定的特殊棋盘上除特殊方格以外的所有方格,且任何2个L型骨牌不得重叠覆盖。,棋盘覆盖,当k0时,将2k2k棋盘分
34、割为4个2k-12k-1 子棋盘(a)所示。 特殊方格必位于4个较小子棋盘之一中,其余3个子棋盘中无特殊方格。为了将这3个无特殊方格的子棋盘转化为特殊棋盘,可以用一个L型骨牌覆盖这3个较小棋盘的会合处,如 (b)所示,从而将原问题转化为4个较小规模的棋盘覆盖问题。递归地使用这种分割,直至棋盘简化为棋盘11。,棋盘覆盖,void chessBoard(int tr, int tc, int dr, int dc, int size)if (size = 1) return;int t = tile+, / L型骨牌号s = size/2; / 分割棋盘/ 覆盖左上角子棋盘if (dr = tc
35、+ s)/ 特殊方格在此棋盘中chessBoard(tr, tc+s, dr, dc, s);else / 此棋盘中无特殊方格/ 用 t 号L型骨牌覆盖左下角,boardtr + s - 1tc + s = t;/ 覆盖其余方格chessBoard(tr, tc+s, tr+s-1, tc+s, s);/ 覆盖左下角子棋盘if (dr = tr + s ,复杂度分析T(n)=O(4k) 渐进意义下的最优算法,循环赛日程表,设计一个满足以下要求的比赛日程表: (1)每个选手必须与其他n-1个选手各赛一次; (2)每个选手一天只能赛一次; (3)循环赛一共进行n-1天。,按分治策略,将所有的选手分为两半,n个选手的比赛日程表就可以通过为n/2个选手设计的比赛日程表来决定。递归地用对选手进行分割,直到只剩下2个选手时,比赛日程表的制定就变得很简单。这时只要让这2个选手进行比赛就可以了。,作业,求n个数的全排列 快速排序,算法,