第5章代码优化.ppt-道客多多_道客多多docduoduo.com

资源描述

1、第5章代码优化,5.1 局部优化 5.2 循环优化 5.3 代码优化示例,5.1 局部优化,局部优化是指对代码的每一个线性部分所进行的优化，使得在这个线性部分只存在一个入口和一个出口，而这个线性部分我们称之为基本块。,5.1.1 基本块的划分方法所谓基本块，是指程序中一顺序执行的语句序列，其中只有一个入口和一个出口，入口就是该序列的第一个语句，出口就是该序列的最后一个语句。对一个基本块来说，执行时只能从其入口进入，从其出口退出。对一个给定的程序，我们可以把它划分为一系列基本块，在各个基本块范围内进行的优化称为局部优化。,划分基本块的关键问题是准确定义入口和出口语句。下面我们给出划分四元

2、式程序为基本块的算法：(1) 从四元式序列确定满足以下条件的入口语句：四元式序列的第一个语句；能由条件转移语句或无条件转移语句转移到的语句；紧跟在条件转移语句后面的语句。,(2) 确定满足以下条件的出口语句：下一个入口语句的前导语句；转移语句(包括转移语句自身)；停语句(包括停语句自身)。,例如，考察下面求最大公因子的三地址代码程序： (1) read X (2) read Y (3) R=X % Y (4) if R=0 goto(8) (5) X=Y (6) Y=R (7) goto(3) (8) write Y (9) halt,5.1.2 基本块的DAG表示DAG(Dire

3、cted Acyclic Graph)是一种有向图，常常用来对基本块进行优化。一个基本块的DAG是一种其结点带有下述标记或附加信息的DAG：(1) 图的叶结点(无后继的结点)以一标识符(变量名)或常数作为标记，表示该结点代表该变量或常数的值。如果叶结点用来表示一变量A的地址，则用addr(A)作为该结点的标记。通常把叶结点上作为标记的标识符加上下标0，以表示它是该变量的初值。,(2) 图的内部结点(有后继的结点)以一运算符作为标记，表示该结点代表应用该运算符对其直接后继结点所代表的值进行运算的结果。(3) 图中各个结点上可能附加一个或多个标识符，表示这些变量具有该结点所代表的值。,一个基本块由

4、一个四元式序列组成，且每一个四元式都可以用相应的DAG结点表示。图51给出了不同四元式和与其对应的DAG结点形式。图中，各结点圆圈中的ni是构造DAG过程中各结点的编号，而各结点下面的符号(运算符、标识符或常数)是各结点的标记，各结点右边的标识符是结点上的附加标识符。除了对应转移语句的结点右边可附加一语句位置来指示转移目标外，其余各类结点的右边只允许附加标识符。除对应于数组元素赋值的结点(标记为 =)有三个后继外，其余结点最多只有两个后继。,图51 四元式与DAG结点,利用DAG进行基本块优化的基本思想是：首先按基本块内的四元式序列顺序将所有的四元式构造成一个DAG，然后按构造结点的次序将DA

5、G还原成四元式序列。由于在构造DAG的同时已作了局部优化，所以最后所得到的是优化过的四元式序列。为了DAG构造算法的需要，我们将图51中的四元式按照其对应结点的后继结点个数分为四类：,(1) 0型四元式：后继结点个数为0，如图51(1)所示；(2) 1型四元式：有一个后继结点，如图51(2)所示；(3) 2型四元式：有两个后继结点，如图51(3)、(4)、(5)所示；(4) 3型四元式：有三个后继结点，如图51(6)所示。,我们规定：用大写字母(如A、B等)表示四元式中的变量名(或常数)；用函数Node(A)表示A在DAG中的相应结点，其值可为n或者无定义，并用n表示DAG中的一个结点值。这样

6、，每个基本块仅含0、1、2型四元式的DAG构造算法如下(对基本块的每一个四元式依次执行该算法)：,(1) 若Node(B)无定义，则构造一标记为B的叶结点并定义Node(B)为这个结点，然后根据下列情况做不同处理：若当前四元式是0型，则记Node(B)的值为n，转(4)。若当前四元式是1型，则转(2)。若当前四元式是2型，则：i. 如果Node(C)无定义，则构造一标记为C的叶结点，并定义Node(C)为这个结点；ii. 转(2)。,(2) 若Node(B)是以常数标记的叶结点，则转(2)，否则转(3)。若Node(B)和Node(C)都是以常数标记的叶结点，则转(2)，否则转(3)。

7、执行op B(即合并已知量)，令得到的新常数为P。若Node(B)是处理当前四元式时新建立的结点，则删除它；若Node(P)无定义，则构造一用P做标记的叶结点n并置Node(P)= n；转(4)。, 执行B op C(即合并已知量)，令得到的新常数为P。若Node(B)或Node(C)是处理当前四元式时新建立的结点，则删除它；若Node(P)无定义，则构造一用P做标记的叶结点n并置Node(P)= n；转(4)。(3) 检查DAG中是否有标记为op且以Node(B)为惟一后继的结点(即查找公共子表达式)。若有，则把已有的结点作为它的结点并设该结点为n；若没有，则构造一个新结点；转(4)。,

8、检查DAG中是否有标记为op且其左后继为Node(B)、右后继为Node(C)的结点(即查找公共子表达式)。若有，则把已有的结点作为它的结点并设该结点为n；若没有，则构造一个新结点；转(4)。(4) 若Node(A)无定义，则把A附加在结点n上并令Node(A)= n；否则，先从Node(A)的附加标识符集中将A删去(注意，若Node(A)是叶结点，则不能将A删去)，然后再把A附加到新结点n上，并令Node(A)=n。解答按照算法顺序处理每一四元式后构造出的DAG如图52所示，其中每一子图(1)、(2)、(10)分别对应四元式(1)(10)的DAG构造。,图52 DAG,构造过程说明如下：(

9、1) 对应图52(2)，四元式T1=2*T0首先执行算法中的步骤(1)，因Node(B)无定义，所以构造一个标记为2的叶结点并定义Node(2)为这个结点；因当前四元式是2型且Node(C)已有定义(此时为Node(T0)，转算法步骤(2)；因Node(B)=Node(2)和Node(C)=Node(T0)都是标记为常数的叶结点，则执行B op C并令新结点为P(=6.28)；由于Node(P)无定义，故构造Node(P)=Node(6.28)；,此外，因Node(B)=Node(2)是处理当前四元式时新构造出来的结点，故删除n2；接下来执行算法步骤(4)，因Node(A)无定义而将T1附加在

10、结点n3上，并令Node(T1)=6.28；最后DAG生成了2个结点n1和n3，因结点n2被删除而将n3改名为n2。图52(2)的形成过程实际上也是合并已知量的优化过程。(2) 图52(4)中T1、T2已有定义，则仅生成一个新结点n6并将A附加在n6上。图5-2(5)中结点B已有定义，故直接附加在n6上。,(3) 图52(6)的处理过程与图52(2)略同，但在生成P时因其已在DAG中(即 Node(6.28)，故不生成新结点而直接将T3附加在结点6.28上。(4) 图52(7)的生成过程实质上是删除多余运算(删除公共子表达式)的优化。因为DAG中已有叶结点R与叶结点r，并且执行op操作后得到的

11、新结点T2也已经在DAG中，故执行算法步骤(4)时因T4无定义而将T4附加在结点n5上。,(5) 图52(9)中，变量R和r已在DAG中有相应的结点，执行“”操作后，产生的新结点P无定义，故仅生成一个新结点n7并将T6标记于其上。(6) 图52(10)中，对当前四元式B=T5*T6，DAG中已有结点T5和T6；执行算法步骤(4)时因结点B已有定义且不是叶结点，故先将原B从DAG中删除，然后生成一个新结点n8，将B附加其上并令Node(B)=n8。这一处理过程实质上是删除了无用赋值B=A。,5.1.3 利用DAG进行基本块的优化处理利用DAG进行基本块优化处理的基本思想是：按照构造DAG结点的顺

12、序，对每一个结点写出其相应的四元式表示。我们根据例5.1DAG结点的构造顺序，按照图52(10)写出四元式序列G 如下：,(1) T0=3.14 (2) T1=6.28 (3) T3=6.28 (4) T2=R+r (5) T4=T2 (6) A=6.28*T2 (7) T5=A (8) T6= Rr (9) B=A*T6,将G和原基本块G相比，我们看到： (1) G中四元式(2)和(6)都是已知量和已知量的运算，G已合并； (2) G中四元式(5)是一种无用赋值，G已将它删除； (3) G中四元式(3)和(7)的R+r是公共子表达式, G只对它们计算了一次，即删除了多余的R+r运算。因此，

13、G是对G实现上述三种优化的结果。,通过观察图52(10)中的所有叶结点和内部结点以及其上的附加标识符，还可以得出以下结论：(1) 在基本块外被定值并在基本块内被引用的所有标识符就是DAG中相应叶结点上标记的标识符；(2) 在基本块内被定值且该值能在基本块后面被引用的标识符就是DAG各结点上的附加标识符。,这些结论可以引导优化工作的进一步深入，尤其是无用赋值的优化，也即：(1) 如果DAG中某结点上的标识符在该基本块之后不会被引用，就可以不生成对该标识符赋值的四元式。(2) 如果某结点ni上没有任何附加标识符，或者ni上的附加标识符在该基本块之后不会被引用，而且ni也没有前驱结点，这表明在基本块

14、内和基本块之后都不会引用ni的值，那么就不生成计算ni结点值的四元式。,(3) 如果有两个相邻的四元式A=C op D和B=A，其中第一条代码计算出来的A值仅在第二个四元式中被引用，则将DAG中相应结点重写成四元式时，原来的两个四元式可以优化为B=C op D。假设例5.1中T0、T1、T2、T3、T4、T5和T6在基本块后都不会被引用，则图5-2(10)中的DAG就可重写为如下的四元式序列：,(1) S1=R+r /*S1、S2为存放中间结果的临时变量*/ (2) A=6.28*S1 (3) S2=Rr (4) B=A*S2,以上把DAG重写成四元式序列时，是按照原来构造DAG结点的顺序(即

15、n5、n6、n7、n8)依次进行的。实际上，我们还可以采用其它顺序(如自下而上)重写，只要其中的任何一个内部结点是在其后继结点之后被重写并且转移语句(如果有的话)仍然是基本块的最后一个语句即可。,5.1.4 DAG构造算法的进一步讨论当基本块中有数组元素引用、指针和过程调用时，构造DAG算法就较为复杂。例如，考虑如下的基本块G： (1) x=ai (2) aj=y (3) z=ai,如果我们用构造DAG的算法来构造上述基本块的DAG，则ai就是一个公共子表达式；且由所构造的DAG重写出优化后的四元式序列G如下： (1) x=ai (2) z=x (3) ai=y,如果ij，则G与G是等效的。但

16、是，如果i=j且yai，则将y值赋给aj的同时也改变了ai的值(因i=j)；这时z值应为改变后的ai值(即y值)，与x不等。为了避免这种情况的发生，当我们构造对数组a的元素赋值句的结点时，就“注销”所有标记为且左边变量是a(可加上或减去一个常数)的结点。我们认为对这样的结点再添加附加标识符是非法的，从而取消了它作为公共子表达式的资格。,对指针赋值语句*p=w(其中p是一个指针)也会产生同样的问题，如果我们不知道p可能指向哪一个变量，那么就认为它可能改变基本块中任何一个变量的值。当构造这种赋值句的结点时，就需要把DAG各结点上所有标识符(包括作为叶结点上标记的标识符)都予以注销，这也就意味着D

17、AG中所有的结点也都被注销。在一个基本块中的一个过程调用将注销所有的结点，因为对被调用过程的情况缺乏了解，我们必须假定任何变量都可能因产生副作用而发生变化。,此外，当把DAG重写成四元式时，如果我们不是按照原来构造DAG结点的顺序进行重写，那么DAG中的某些结点必须遵守一定的顺序。例如，在上述基本块G中，z=ai必须跟在aj=y之后，而aj=y则必须跟在x=ai之后。下面，我们根据上述讨论把重写四元式时DAG中结点间必须遵守的顺序归纳如下：,(1) 对数组a中任何元素的引用或赋值，都必须跟在原来位于其前面的(如果有的话，下同)对数组a任何元素的赋值之后；对数组a任何元素的赋值，都必须跟在原来位

18、于其前面的对数组a任何元素的引用之后。(2) 对任何标识符的引用或赋值，都必须跟在原来位于其前面的任何过程调用或通过指针的间接赋值之后；任何过程调用或通过指针的间接赋值，都必须跟在原来位于其前面的任何标识符的引用或赋值之后。,5.2 循环优化,5.2.1 程序流图与循环为了进行循环优化，必须先找出程序中的循环。由程序语言的循环语句形成的循环是不难找出的，但由条件转移语句和无条件转移语句同样可以形成程序中的循环，并且其结构可能更加复杂。因此，为了找出程序中的循环，就需要对程序中的控制流程进行分析。我们应用程序的控制流程图来给出循环的定义并找出程序中的循环。,一个控制流程图(简称流图)就是具

19、有惟一首结点的有向图。所谓首结点，就是从它开始到控制流程图中任何一个结点都有一条通路的结点。我们可以把控制流程图表示成一个三元组G=(N,E,n0)；其中，N代表图中所有结点集，E代表图中所有有向边集，n0代表首结点。,一个程序可用一个流图来表示。流图的有限结点集N就是程序的基本块集，流图中的结点就是程序的基本块，流图的首结点就是包含程序第一个语句的基本块。流图的有向边集E是这样构成的：假设流图中结点i和结点j分别对应于程序的基本块i和基本块j，则当下述条件有一个成立时，从结点i有一条有向边引到结点j：,(1) 基本块j在程序中的位置紧跟在基本块i之后，并且基本块i的出口语句不是无条件转移语句

20、goto(s)或停语句。(2) 基本块i的出口语句是goto(s)或if goto(s)，并且(s)是基本块j的入口语句。在以后的讨论中，我们所涉及的流图都是程序流图。程序流图和基本块的DAG是不同的概念。程序流图是对整个程序而言的，它表示了各基本块(对应流图中的一个结点)之间的控制关系，图中可以出现环路；DAG是对基本块而言的，是局限于该基本块内的无环路有向图，它表示了这个基本块内各四元式的操作及相互关系。,我们仍以下面求最大公因子的三地址代码程序为例来求其程序流图。,(1) read X (2) read Y (3) R=X % Y (4) if R=0 goto (8) (5) X=Y

21、(6) Y=R (7) goto (3) (8) write Y (9) halt,图53 求最大公因子的程序流图,我们知道，该程序的基本块分别为：(1)(2)，(3)(4)，(5)(6)(7)和(8)(9)，按构造流图结点间有向边的方法，我们得到该程序的程序流图如图53所示。有了程序流图，我们就可以对所要讨论的循环结构给出定义。在程序流图中，我们称具有下列性质的结点序列为一个循环：,(1) 它们是强连通的，其中任意两个结点之间必有一条通路，而且该通路上各结点都属于该结点序列；如果序列只包含一个结点，则必有一条有向边从该结点引到其自身。(2) 它们中间有一个而且只有一个是入口结点。所谓入口结点

22、，是指序列中具有下述性质的结点：从序列外某结点有一条有向边引到它，或者它就是程序流图的首结点。,例如，对图53所示的程序流图，由上述循环的定义可知，结点序列B2，B3是程序中的一个循环，其中，B2是循环的惟一入口结点。对图54所示的程序流图，结点序列6因其只有一个结点且有一有向边引到自身，并且只有惟一的入口结点6，故是我们所定义的循环；而2, 3, 4, 5, 6, 7中的任意两个结点之间都存在通路(即为强连通)，且有惟一的入口结点2，故也是我们所定义的循环；此外，4, 5, 6, 7也是强连通且有惟一入口结点4，虽然到入口结点4的有向边不止一条，但仍然是我们所定义的循环。,图54 程序流图,

23、而2, 4和2, 3, 4，它们虽然是强连通的，但却存在两个入口结点2、4，故不是我们所定义的循环；4, 5, 7和4, 6, 7也因其存在两个入口结点4、7而不是我们所定义的循环。,5.2.2 循环的查栈1必经结点集为了找出程序流图中的循环，需要分析流图中结点的控制关系，为此我们引入必经结点和必经结点集的定义。在程序流图中，对任意结点m和n，如果从流图的首结点出发，到达n的任一通路都要经过m，则称m是n的必经结点，记为m DOM n；流图中结点n的所有必经结点的集合称为结点n的必经结点集，记为D(n)。,显然，循环的入口结点是循环中所有结点的必经结点；此外，对任何结点n来说都有n DOM n

24、。如果把DOM看作流图结点集上定义的一个关系，则由定义容易看出它具有下述性质：(1) 自反性：对流图中任意结点a，都有a DOM a。(2) 传递性：对流图中任意结点a、b、c，若存在a DOM b和b DOM c, 则必有a DOM c。(3) 反对称性：若存在a DOM b和b DOM a，则必有a=b。,例5.2 求图54中流图各结点的D(n)。解答考察图54的流图并由必经结点的定义容易看出：首结点1是所有结点的必经结点；结点2是除去结点1之外所有结点的必经结点；结点4是结点4、5、6、7的必经结点；而结点3、5、6、7都只是其自身的必经结点。因此，直接由定义和DOM的性质可求得：,D

25、(1)=1 D(2)=1，2 D(3)=1，2，3 D(4)=1，2，4 D(5)=1，2，4，5 D(6)=1，2，4，6 D(7)=1，2，4，7,下面我们给出求流图G=(N，E，n0)的所有结点n的必经结点集D(n)的算法；其中，P(n)代表结点n的前驱结点集，它可以从边集E中直接求出。 D(n0)=n0; for (nNn0) D(n)=N; /*置初值*/ change=true; while (change)change=false;,for (nNn0)if (new!=D(n)change=true;D(n)=new;,图55 ni为nj的必经结点示意,例5.3 应用求流图必经

26、结点集的算法求图54流图各结点n的D(n)。解答算法求解过程如下：首先置初值： D(1)=1D(2)=D(3)=D(4)=D(5)=D(6)=D(7)=1,2,3,4,5,6,7置change为false，然后从结点2到结点7依次执行第二个for循环。,对结点2，因 new=2D(1)D(4)=211,2,3,4,5,6,7=21=1,2但迭代前D(2)=1,2,3,4,5,6,7，故D(2)new，因此置change=true并令D(2)=1,2。对结点3，因 new=3D(2)=31,2=1,2,3但迭代前D(3)=1,2,3,4,5,6,7，故D(3) new，因此令D(3)=1，

27、2，3。其余各结点按照上述步骤可求出： D(4)=4D(2)D(3)D(7)=41,21,2,31,2,3,4,5,6,7=1,2,4,D(5)=5D(4)=1,2,4,5 D(6)=6D(4)=1,2,4,6 D(7)=7D(5)D(6)=71,2,4,51,2,4,6=1,2,4,7 一次迭代完毕后，因change为true，故还要进行下一次迭代。先令change为false，然后继续从结点2到结点7依次执行第二个for循环。对结点2，因 new=2D(1)D(4) =211,2,4 =21=1,2,而迭代前D(2)=1,2，所以D(2)=new，故D(2)不变。对结点3，因 ne

28、w=3D(2) =31,2=1,2,3及迭代前D(3)=1,2,3，所以D(3)=new，故D(3)不变。对其余结点n(n=47)求出的new均有D(n)=new，所以第二次迭代后change为false，迭代结束，第一次迭代求出的各个D(n)就是最后的结果。,2回边查找循环的方法是：首先应用必经结点集来求出流图中的回边，然后利用回边找出流图中的循环的。回边的定义如下：假设ab是流图中一条有向边，如果b DOM a，则称ab是流图中的一条回边。,对于一已知流图G，只要求出各结点n的必经结点集，就可以立即求出流图中的所有回边。在求出流图G中的所有回边后，就可以求出流图中的循环。如果已知有向边nd

29、是一条回边，则由它组成的循环就是由结点d、结点n以及有通路到达n但该通路不经过d的所有结点组成的。,例5.4 求出图54流图的所有回边。解答 (1) 已知D(6)=1,2,4,6，因存在66且6 DOM 6，故66是回边；(2) 已知D(7)=1,2,4,7，因存在74且4 DOM 7，故74是回边；(3) 已知D(4)=1,2,4，因存在42且2 DOM 4，故42是回边。容易看出，其它有向边都不是回边。,寻找由回边组成循环的算法如下： main ( )stack=空; /*stack是一个工作栈*/loop=d; /*loop是所求的循环*/insert(m);while (stack非空

30、),弹出stack栈顶元素m;for (pP(m) /*P(m)为结点m的前驱结点集*/insert (p); void insert (m),if (mloop)loop=loopm; 把m压入栈stack; ,此算法在求回边nd组成循环的所有结点的方法是：由于循环以d为其惟一入口，n是循环的一个出口，只要n不同时是循环入口d，那么n的所有前驱就应属于循环。在求出n的所有前驱之后，只要它们不是循环入口d，就应再继续求出它们的前驱，而这些新求出的所有前驱也应属于循环。然后再对新求出的所有前驱重复上述过程，直到所求出的前驱都是d为止。,3可归约流图一个流图被称为可归约的，当且仅当流图中除去回边之

31、外，其余的边构成一个无环路流图。例如，图54中的流图就是一个可归约流图，而图56则是一个不可归约流图，因为图56中虽然有23，但没有3 DOM 2，即23不是一个回边，对32也是如此。,如果程序流图是可归约的，那么程序中任何可能反复执行的代码都会被求回边的算法纳入到一个循环当中。可归约流图是一类非常重要的流图，从代码优化的角度来说，它具有下述重要的性质：(1) 图中任何直观意义下的环路都属于我们所定义的循环。(2) 只要找出图中的所有回边，对回边应用查找循环的方法就可以找出流图中的所有循环。,图56 不可归约流图,(3) 图中任意两个循环要么嵌套，要么不相交(除了可能有公共的入口结点)，对这类

32、流图进行循环优化较为容易。应用结构程序设计原则写出的程序，其流图总是可归约的；而应用高级语言写出的程序，其流图往往也是可归约的。,例5.4 四元式序列如下： (1) J=0； (2) L1：I=0； (3) if I 8 goto L3; (4) L2：A=B+C； (5) B=D*C; (6) L3：if B=0 goto L4; (7) write B;,(8) goto L5; (9) L4 ：I= I+1; (10) if I8 goto L2; (11) L5：J= J+1; (12) if J3 goto L1; (13) halt 画出该四元式序列的程序流图G并求出G中的回边与循

33、环。,解答该四元式序列的基本块与程序流图如图57所示。图57中各结点的必经结点集如下： D(B1)=B1 D(B5)=B1,B2,B4,B5 D(B2)=B1,B2 D(B6)=B1,B2,B4,B6 D(B3)=B1,B2,B3 D(B7)=B1,B2,B4,B7 D(B4)=B1,B2,B4 D(B8)=B1,B2,B4,B7,B8,图57 程序流图,考查流图中的有向边B7B2且已知D(B7)=B1,B2,B4,B7，所以有B2 DOM B7，即B7B2是流图中的回边。容易看出，其它有向边都不是回边。因B7B2是一条回边，则在流图中能够不经过结点B2且有通路到达结点B7的结点只有B3、B

34、4、B5和B6，故由回边B7B2组成的循环是： B2, B3, B4, B5, B6, B7。,5.2.3 循环优化对循环中的代码可以实行代码外提、强度削弱和删除归纳变量等优化。1代码外提循环中的代码要随着循环反复执行，但其中某些运算的结果并不因循环而改变，对于这种不随循环变化的运算，可以将其外提到循环外。这样，程序的运行结果仍保持不变，但程序的运行效率却提高了。我们称这种优化为代码外提。,实行代码外提时，在循环入口结点前面建立一个新结点(基本块)，称为循环的前置结点。循环前置结点以循环入口结点为其惟一后继，原来流图中从循环外引到循环入口结点的有向边改成引到循环前置结点，如图58所示。因为在我

35、们所定义的循环结构中，其入口结点是惟一的，所以前置结点也是惟一的。循环中外提的代码将统统外提到前置结点中。但是，循环中的不变运算并不是在任何情况下都可以外提的；对循环L中的不变运算S：A=B op C或A= op B或A=B，要求满足下述条件(A在离开L后仍是活跃的)：,(1) S所在的结点是L的所有出口结点的必经结点；(2) A在L中其它地方未再定值；(3) L中的所有A的引用点只有S中A的定值才能到达。对上述三个条件，我们给出图59所示的三种流图予以说明。,图58 给循环建立前置结点,图59 代码外提的程序流图示例,(1) 对图59(a)，先将B3中的循环不变运算I=2外提到循环前置结点B

36、2中，如图510所示。由图59(a)可知，B3并不是出口结点B4的必经结点。如果令X=30，Y=25，则按图59(a)的流图，B3是不会执行的；于是，当执行到B5时，I的值是1。但是，如果按图510执行，则执行到B5时，I的值总是2，所以图510改变了原来程序运行的结果。出现以上问题是因为B3不是循环出口结点B4的必经结点，所以当把一不变运算外提到循环前置结点时，要求该不变运算所在的结点是循环所有出口结点的必经结点。,图510 将图58(a)中的I=2外提后的程序流图,(2) 考查图59(b)，现在I=3所在的结点B2是循环出口结点的必经结点，但循环中除B2外，B3也对I定值。如果把B2中的I

37、=3外提到循环前置结点中，且循环前X=21和Y=22，程序此时执行的顺序是B2B3B4B2B4B5，则到达B5时I值为2；但如果不把B2中的I=3外提，则经过以上执行顺序到达B5时，I值为3。由此可知，当把循环中的不变运算A=B op C外提时，要求循环中其它地方不再有A的定值点。,(3) 考查图59(c)，不变运算I=2所属结点B4本身就是出口结点，而且此循环只有一个出口结点，同时循环中除B4外其它地方没有I的定值点；因此，它满足外提的条件(1)、(2)。我们注意到，对循环中B3的I的引用点，不仅B4中I的定值能够到达，而且B1中I的定值也能到达。现在考虑进入循环前X=0和Y=2时的情况，此

38、时循环的执行顺序为B2B3B4B2B4B5，当到达B5时A值为2；但如果把B4中的I=2外提，则到达B5时A值为3。因此当把循环不变运算A=B op C外提时，要求循环中A的所有引用点都是而且仅仅是该定值所能到达的。,根据以上讨论，给出查找所需处理的循环L中的不变运算和代码外提的算法如下：(1) 依次查看L中各基本块的每个四元式，如果它的每个运算对象为常数或者定值点在L外，则将此四元式标记为“不变运算”。(2) 依次查看尚未被标记为“不变运算”的四元式，如果它的每个运算对象为常数或定值点在L之外，或只有一个到达定值点且该点上的四元式已标记为“不变运算”，则把被查看的四元式标记为“不变运算”。,

39、(3) 重复第(2)步直至没有新的四元式被标记为“不变运算”为止。例如，循环中的A=3已标记为“不变运算”，则对循环中A=3定值点可惟一到达的X=A+2也标记为“不变运算”。,找出了循环的不变运算就可以进行代码外提了。代码外提算法如下：(1) 求出循环L的所有不变运算。(2) 对步骤(1)所求得的每一不变运算S：A=B op C或A= op B或A=B，检查它是否满足以下条件： i. S所在的结点是L的所有出口结点的必经结点；ii. A在L中其它地方未再定值；iii. L中所有A的引用点只有S中A的定值才能到达。, A在离开L后不再是活跃的(即离开L后不会引用该A值)，并且条件的ii.和iii

40、.两条成立。所谓A在离开L后不再是活跃的是指A在L的任何出口结点的后继结点(当然是指那些不属于L的后继)的入口处不是活跃的。,(3) 按步骤(1)所找出的不变运算的顺序，依次把步骤(2)中满足条件的不变运算S外提到L的前置结点中。但是，如果S的运算对象(B或C)是在L中定值的，那么只有当这些定值四元式都已外提到前置结点中时，才可把S也外提到前置结点中(B、C的定值四元式提到前置结点后，S的运算对象B、C就属于定值点在L之外了，因此也就是真正的“不变运算”)。,例5.5 试对图511给定的程序流图进行代码外提优化。解答确定不变运算的原则是依次查看循环中各基本块的每个四元式，如果它的每个运算对象

41、为常数或者定值点在循环外，则将此四元式标记为“不变运算”。查看图511的程序流图，可以找出的不变运算是B3中的I=2和B4中的J=M+N。进行代码外提时，只能将J=M+N提到循环前置结点，而B3中的I=2虽然是不变运算，但B3不是循环所有出口结点的必经结点，且循环中所有I的引用点并非只有B3的I定值能够到达，故B3中的I=2不能外提。最后，得到代码外提后的程序流图如图512所示。,图511 例5.5的程序流图,图512 代码外提后的程序流图,2强度削弱强度削弱是指把程序中执行时间较长的运算替换为执行时间较短的运算。强度削弱不仅可对乘法运算实行(将循环中的乘法运算用递归加法运算来替换)，对加法运

42、算也可实行。,如果循环中有I的递归赋值I=IC(C为循环不变量)，并且循环中T的赋值运算可化归为T=K*IC1(K和C1为循环不变量)，那么T的赋值运算可以进行强度削弱。进行强度削弱后，循环中可能出现一些新的无用赋值，如果它们在循环出口之后不是活跃变量则可以从循环中删除。此外，对下标变量地址计算来说，强度削弱实际就是实现下标变量地址的递归计算。,例5.6 试对图513给定的程序流图进行强度削弱优化。解答由图513的流图可以看出，B2中的A=K*I和B=J*I因计算K、J的四元式都在循环之外，故可将K、J看作常量，而每次循环I=I+1即I增加1时，对应A=K*I和B=J*I分别增加K和J。因此

43、，可以将A=K*I和B=J*I外提到前置结点B2中，同时在B2的I=I+1之后分别给A和B增加一个常量K和J。进行强度削弱后的流图如图514所示。,图513 例5.6的程序流图,图514 例5.6强度削弱后的流图,例5.7 试对图515给定的程序流图进行强度削弱优化。解答强度削弱不仅可对乘法运算进行，也可对加法运算进行。由于本题中的四元式程序不存在乘法运算，所以只能进行加法运算的强度削弱。从图515中可以看到，B2中的C=B+I，B的定值点在循环之外，故相当于常数；而另一加数I值由B3中的I=I+1决定，即每循环一次I值增1；,图515 例5.7的程序流图,图516 例5.7强度削弱后的流图

44、,也即每循环一次，B2中C=B+I的C值增量与B3中的I相同，为常数1。因此，我们可以对C进行强度削弱，即将B2中的四元式C=B+I外提到前置结点B2中，同时在B3中I=I+1之后给C增加一个常量1。进行强度削弱后的结果如图516所示。,例5.8 试对图5-17给定的程序流图进行强度削弱优化。解答由图517的B3看到，T2是递归赋值的变量，每循环一次增加一个常量10。因T3=T2 +T1计算T3值时要引用T2的值，它的另一运算对象是循环不变量T1，所以每循环一次，T3值的增量与T2相同，即常数10。因此，我们可以对T3进行强度削弱，即将T3=T2 +T1外提到前置结点B2中，同时在T2=T2

45、 +10的后面给T3增加一个常量10。进行以上强度削弱后的结果如图518所示。,图517 例5.8程序流图,图518 例5.8强度削弱后的流图,3删除归纳变量如果循环中对变量I只有惟一的形如I=IC的赋值，且其中C为循环不变量，则称I为循环中的基本归纳变量。如果I是循环中一基本归纳变量，J在循环中的定值总是可化归为I的同一线性函数，也即J=C1*IC2，其中C1和C2都是循环不变量，则称J是归纳变量，并称它与I同族。一个基本归纳变量也是一归纳变量。,一个基本归纳变量除用于其自身的递归定值外，往往只在循环中用来计算其它归纳变量以及控制循环的进行。此时，可以用同族的某一归纳变量来替换循环控制条件中

46、的这个基本归纳变量，从而达到将这个基本归纳变量从流图中删去的目的。这种优化称为删除归纳变量或变换循环控制条件。由于删除归纳变量是在强度削弱以后进行的，因此，我们一并给出强度削弱和删除归纳变量的算法如下：,(1) 利用循环不变运算信息，找出循环中所有基本归纳变量。(2) 找出所有其它归纳变量A，并找出A与已知基本归纳变量X的同族线性函数关系FA(X)；即：在L中找出形如A=B*C、A=C*B、A=B/C、A=BC、A=CB的四元式，其中B是归纳变量，C是循环不变量。, 假设找出的四元式为S：A=C*B，这时有：i. 如果B就是基本归纳变量，则X就是B，A与基本归纳变量B是同族的归纳变量，且A与

47、B的函数关系就是FA(B)=C*B。ii. 如果B不是基本归纳变量，假设B与基本归纳变量D同族且它们的函数关系为FB(D)，那么如果L外B的定值点不能到达S且L中B的定值点与S之间未曾对D定值，则X就是D，A与基本归纳变量D是同族的归纳变量，且A与D的函数关系是FA(D)=C*B=C*FB(D)。,(3) (强度削弱)对(2)中找出的每一归纳变量A，假设A与基本归纳变量B同族，而且A与B的函数关系为FA(B)=C1*B+C2，其中C1和C2均为循环不变量，C2可能为0，执行以下步骤：建立一个新的临时变量。如果两个归纳变量A和A都与B同族且FA(B)=FA(B)，则只建立一个临时变量。在循环

48、前置结点原有的四元式后面增加下面的四元式：,=C1*B=+C2 (注：实现A=C1*B+C2)如果C2=0，则无四元式=+C2。把循环中原来对A赋值的四元式改为A=。在循环中基本的归纳变量B的惟一赋值B=BE(E是循环不变量)后面增加下面的四元式：,(4) 依次考察第(3)步中每一归纳变量A，如果在A=与循环中任何引用A的四元式之间没有对的赋值且A在循环出口之后不活跃，则删除A=并把所有引用A的地方改为引用。(5) (删除基本归纳变量)如果基本归纳变量B在循环出口之后不是活跃的，并且在循环中除在其自身的递归赋值中被引用外，只在形为if B rop Y goto Z(或if Y rop B goto Z)中被引用，则：, 选取一与B同族的归纳变量M，并设FM(B)=C1*B+C2(尽可能使所选M的FM(B)简单，并且可能的话，使M是循环中其它四元式要引用的或者是循环出口之后的活跃变量)。建立一临时变量R，并用下列四元式：R=C1* Y (如果C1=1则C1不出现)R=R+ C2 (如果C2=0则无此四元式)if FM(B) rop R goto Z (或if R rop FM(B) goto Z),

展开阅读全文

第5章 代码优化.ppt

第5章代码优化.ppt