第五章语义分析和中间代码生成.ppt-道客多多

资源描述

1、语义分析和中间代码生成,第五章,本章要求,主要内容：语义分析和中间代码的功能，中间代码的形式，属性文法及语法制导的翻译程序，各种语句的语法制导的翻译过程重点掌握：属性文法，语义分析与处理的方法,中间代码的表示形式，各种语句的代码结构，各种语句的翻译方法,语义分析和中间代码生成所处的位置：,5.1 概述,. 语义分析和中间代码生成在编译器中的位置：,静态语义检查：如：类型、运算、数组维数、越界等的检查语义处理：如：变量的存储分配、表达式的求值、语句的翻译(中间代码的生成) 总目标：生成等价的中间代码,. 功能及任务：P166,输入 -语法分析单位,输出- 用中间代码形式表示的文本- 出错处理

2、: 定位、继续编译,3. 为什么要此阶段? 逻辑结构清楚；利于不同目标机上实现同一种语言；利于进行与机器无关的优化，这些内部形式也能用于解释。 4. 什么是中间代码(Intermediate code) 源程序的一种内部表示，不依赖目标机的结构，易于机械生成目标代码的中间表示。 5. 中间代码的几种形式逆波兰、三元式、间接三元式、四元式、树,1、逆波兰式：运算对象写在前，运算符写在后(后缀表示形式) 例：a+b ab+ (a+b)*c ab+c*a+b*c abc*+a:=b*c+b*d abc*bd*+:=,5.2中间代码的几种形式,优点：易于计算机处理利用栈，将扫描到的运算对象入栈，

3、碰到运算符：若是双目运算符，则对栈顶的两个运算对象实施该运算并将运算结果代替这两个运算对象进栈；若是单目运算符，对栈顶元素，执行该运算，将运算结果代替该元素进栈，最后结果即栈顶元素。,练习,写出下列算式的逆波兰表示 a+b*(c+d/e)a:=b*(-c)+b *(-34) not A or not (C or not D),abcde/+*+ a b c - * b 34 - * + := A not C D not or not or,后缀式的推广,(1)赋值语句A:=E，后缀式为：AE:= (2)转向语句GOTO L的后缀式为：Ljmp (3)条件语句if xy then m:=x el

4、se m:=y,2、三元式编号（运算符，第一运算数，第二运算数）如：a：= b*c+b*d(1)（*，b，c）(2)（*，b，d）(3)（+，(1)，(2)）(4)（：=，(3)，a）对于单目运算符，只有一个运算对象，另一个为空注意：在三元式中的编号既代表了序号，又代表了结果的存放位置。,3、四元式P172是目前最常用的中间代码形式:(运算符，第一运算数，第二运算数，结果) 例：a:=b*c+b*d(1)(*,b,c,t1) (2)(*,b,d,t2)(3)(+,t1,t2,t3) (4)(:=,t3, ,a)也可以写成赋值语句形式：(1)t1:=b*c (2)t2:=b*d(3)t3

5、:=t1+t2 (4)a:=t3,练习,求 -B+C*D 的逆波兰表示形式、三元式和四元式,到目前为止，已知输入的语法单位，又知道要翻译的结果的形式，翻译的方法是什么？,语义分析和翻译的方法：语义表示较流行的方法仍然是属性文法，翻译方法是语法制导的翻译。,属性文法,属性文法:是在上下文无关文法的基础上，为每个文法符号(含终结符和非终结符)配备若干个属性值，对文法的每个产生式都配备了一组属性计算规则(称为语义规则)。在语法分析过程中，完成语义规则所描述的动作，从而实现语义处理。属性：代表与文法符号相关的信息，如类型、值、代码序列、符号表的内容等。与变量一样，可以进行计算和传递，属性的加

6、工过程就是语义的处理过程。,属性分两类：综合属性：用于自下而上传递信息继承属性：用于自上而下传递信息注意：终结符只有综合属性，它由词法分析器提供；非终结符可有综合属性，也可有继承属性，它由词法分析器提供；文法的开始符号的所有继承属性作为属性计算前的初始值,产生式右边的文法符号的继承属性可以继承左边的文法符号的继承属性产生式左边的文法符号可以通过综合右边的文法符号的综合属性而得到但必须提供一个计算规则：计算规则中只能使用相应产生式中的文法符号的属性。实际应用中，一个结点的综合属性的值由其子结点的综合属性值决定(产生式右边)。一个结点的继承属性由此结点的父结点和/或兄结点的某些属

7、性决定(产生式左边)。但产生式左边的继承属性和右边的综合属性不由所给的产生式的属性计算规则进行计算，它们由其它产生式的属性计算规则提供。,digitlexval:=3,Fval:=3,Tval:=3,Fval:=5,Tval:=15,*,Eval:=15,+,digitlexval:=4,Fval:=4,Tval:=4,Eval:=19,L,n,digitlexval:=5,若输入符号串为：3*5+4n,例：综合属性的计算,C语言中变量定义： int id1,id2,id3,综合属性的传递,继承属性的传递,例：继承属性的计算,语义规则描述的工作：属性计算、静态语义检查、符号表的操作、代

8、码生成等，通常写成过程和函数调用，称为语义子程序。语义翻译常用的方法：语法制导翻译：定义翻译所必须的语义属性和语义规则，一般不涉及计算顺序。,语法制导翻译技术,语法制导翻译(Syntax-Directed Translations)：一个句子的语义翻译过程与语法分析过程同时进行。在文法中，文法符号有明确的意义，文法符号之间有确定的语义关系。属性描述语义信息，语义规则描述属性间的的关系，将语义规则与语法规则相结合，在语法分析的过程中计算语义属性值。,语法制导翻译的处理方法,对应每一个产生式编制一个语义子程序，在进行语法分析的过程中，当一个产生式获得匹配时，就调用相应的语义子程序实现语义检

9、查与翻译。即在自底向上语法分析的过程中，每一次归约时就调用相应的语义子程序。在产生式的右部的适当位置，插入相应的语义动作，按照分析的进程，执行遇到的语义动作。,语义子程序一个语义子程序描述了一个产生式对应的翻译工作。主要有：改变编译程序某些变量的值、查填各种符号表、发现并报告源程序错误、产生中间代码。在描述语义动作时需要为每个文法符号赋以各种不同的语义值，如类型、地址、代码值等。如果一个产生式中一个符号多次出现，就用上角标来区分，如：E = E(1) + E(2),语义子程序的一般形式语义子程序写在该产生式后面的花括号内： (1) X 语义子程序1 (2) Y 语义子程序2 (3)

10、 AXY 语义子程序3 例：台式计算器程序的语义子程序描述：产生式语义子程序 (0) SE PRINT E.VAL (1) EE(1)+E(2) E.VAL:=E(1).VAL+E(2).VAL (2) EE(1)*E(2) E.VAL:=E(1).VAL*E(2).VAL (3) E(E(1) E.VAL:= E(1).VAL (4) Ei E.VAL:=LEXVAL,各种语句的翻译,高级语言的语句分类：说明语句定义各种名字的属性可执行语句用于完成指定的功能，涉及到指令代码语义翻译也分两类：翻译说明语句时，将所定义的名字的各种属性登记到符号表中翻译可执行语句时，首先应根据各源语句

11、的语法结构和语义设计出它的目标代码结构，找出源与目标的对应关系，给出对信息(数据表示)描述和从源到目标的变换算法。语义子程序则根据变换方法进行翻译。,常见的语法制导翻译类型：语法分析采用自底向上方法时，使用与语法分析栈同步操作的语义栈进行语法制导翻译。语法分析采用递归下降分析方法时，利用隐含堆栈存储各递归子程序中的局部变量所表示的语义信息语法分析采用LL(1)分析法时，利用翻译文法进行语法制导的翻译。翻译文法是在描述语言的文法中加入语义动作的符号。利用属性文法进行翻译。属性文法也是一种翻译文法，它的文法符号和动作符号都带有语义属性和同一产生式中各属性间的运算规则。,自底向上的语法制导翻

12、译,为了正确理解，需要弄清楚：自底向上翻译的特点各种语句的目标结构从源到目标的变换方法,自底向上翻译的特点,使用上图形式的栈实现增加语义栈用X.Val表示文法符号X的语义信息。语义信息与文法符号同时出栈和入栈下面以一个例子来说明自底向上的翻译方法,例1：下面是一个算术表达式文法，每个产生式右边是它的语义动作，对输入串* 3 + 2的规范归约的分析过程如下：,例2：在2*32的LR分析过程中增加了语义栈后的语法制导的实现过程。,(1) EE+T|T (2) TT*F|F (3) F(E)|i,结论,在刚才的翻译过程中有如下特点：句柄归约在先，语义动作在后。归约时，栈内句柄各符号的

13、语义信息与该句柄同时出栈，整个句柄所表示的语义信息则赋给相应产生式左部非终结符的语义变量，并让该非终结符及其语义变量同时入栈。为了在某处调用语义动作，就必须先归约，因此，有时需要改写文法。,说明语句的翻译,说明语句的作用：就是说明类型等属性信息，在翻译时主要是填符号表说明语句分多种，此处举例两种的翻译：变量说明语句的翻译常量说明语句的翻译,变量说明语句的翻译,. 变量说明语句的文法描述,. 变量说明语句的翻译,例如： var a,b,c: integer;,策略：先翻译第，产生式，再翻译，产生式，以便记录的类型，即在写程序时，读完一个说明语句，开始归约，再开始翻译，变量的类型朝前传递

14、。,. 翻译的语义动作,FILL(entry(i),Type)表示将类型Type填入符号表中,entry(i) 表示变量名i在符号表中的入口,符号表：,VAR id1,id2,id3:integer;的归约过程,常量说明语句的翻译,. 常量说明语句的文法描述,. 常量说明语句的翻译,策略：和变量说明一样，先翻译后面的产生式，再翻译前面的产生式，以便在归约时，执行语义动作，将常量的值、类型、种属填入符号表。,例：,Constant A=123,. 翻译的语义动作,将常量INT在符号表中的入口或值直接填入常量符号i所指符号表的VAL栏,将常数的类型填入符号表的Type栏,3，4产生式的翻译与5，6

15、产生式的翻译相同 1，2产生式没有语义动作,将常数的种属填入符号表的Kind栏,可执行语句的翻译,定义的一些语义变量和过程 GENCODE(OP,ARG1,ARG2,RESULT)：语义过程，产生一个四元式，并填入四元式表，编号自动增1 。 NEWT：函数，返回一个临时变量序号。在翻译可执行语句的过程中，可能需要使用临时变量，假定用NEWT过程来申请临时变量Ti，每申请一次，i增1。 ENTRY(i)：函数，查找变量i的入口地址；检查id.name是否在符号表中，如在则返回一指向该登陆项的指针，否则返回NULL E.PLACE：与给终结符E相联系的语义变量，可能是某变量的入口地址，或者为临时变

16、量序号。,简单赋值语句的翻译,. 简单赋值语句的文法描述,2. 简单赋值语句的代码结构,例如：x := 2+3 * 2;,3. 简单赋值语句的翻译此处只假定是整数运算,例：赋值句A:=B+C*(-D)的自底向上分析设：翻译此赋值句之前四元式的最大编号为K,因此，四元式表中增加了4条四元式：,布尔表达式的翻译,3 .布尔表达式的文法描述,.布尔表达式的作用用作控制语句中的条件表达式用在逻辑赋值语句中 2 .布尔表达式的形式 (1)单个布尔量;(2) 布尔量的运算not, and,or, 优先级比关系运算高;(3)关系运算:E1 rop E2, E1E2是算术表达式，rop为关系运算符: ,=,

17、=,=,例如：x := not a and (yz);,布尔量翻译为两条四元式： (jnz, A,_,P): 真出口，当A为真时跳转到四元式P (j, _,_,q) : 假出口，无条件跳转到四元式q 关系表达式也翻译为两条四元式： (jrop, i1, i2, P) : 真出口，当i1 rop i2为真时转四元式P (j, _,_,q) : 假出口，无条件跳转到四元式q,3.布尔量的代码结构每个布尔量(布尔变量或关系表达式)的目标结构有两个出口，真出口指向为真时应跳转的位置；假出口指向为假时应跳转的位置。,类似于编写汇编代码,在翻译布尔表达式时，后面的语句未翻译，P,q如何知道？,解决方法

18、是：回填技术已知就直接填入；不知时先填0，等知道后再返填若多个因子的转移去向相同，但又不知道具体位置，应该用链将这些未知且出口相同的四元式链在一起。布尔表达式: A and B and CD 的四元式为：,假出口未知，填入0,当扫描到and时，对A进行归约，产生两个四元式1，2，其中真出口已知，为3,当扫描到B后的and时，对B进行归约，又产生两个四元式3，4，其中真出口已知，为5,假出口仍未知，但它与A的假出口相同，则链接起来，填2,当扫描到最后，对CD进行归约，又产生两个四元式5，6，此时真出口未知，填0,假出口仍未知，但它与上两个布尔量的假出口相同，则链接起来，填4,生成了真、假出

19、口两个链，两个0就是待填部分。等到以后翻译到后面再填入。,将P1,P2为链首两个四元式链合并在一起，可以用下述过程，返回合并后的四元式链首：,merge(P1，P2) if P2 = 0) return (P1);else P := P2;while (四元式P的第4分量内容不为0) doP := 四元式P的第4分量内容；把P1填进四元式P的第4分量；return (P2); ,假出口链上的四元式应转向相同的位置，所以一旦知道转向的真实位置，就应返填，返填是将已知位置填入链上的所有四元式的第四个分量。用backpatch，把已知位置t填入以P为链首的四元式中：,BACKPATCH(P，t)

20、Q:=P;while (Q!=0) do m := 四元式Q的第4分量内容；把t填进四元式Q的第4分量；Q := m; ,4 .布尔表达式的翻译布尔表达式是带有not, and, or 的表达式第一种翻译方法可以象算术表达式一样翻译，先计算每个因子的值，再计算整个表达式的值。第二种翻译方法采取优化措施进行翻译。,E1 or T 的优化：只要E为真，后面的表达式就不必计算，只有当E为假时才读取T，目标结构如下：,E1 and T 的优化：只要E为假，后面的表达式就不必计算，只有当E为真时才读取T，目标结构如下：,如果是翻译not E1，则E的真假出口正好与E1相反,5. 翻译布尔表达式时

21、，当读到not, and, or时，要进行归约，因此应对文法进行改造，改造前后的文法为：,改造后的文法,改造前的文法,6. 总结前面的分析，各产生式的翻译为：,NXQ表示当前产生的四元式的编号,单个的布尔量,关系运算,Not逻辑运算,带算术运算的关系运算,产生式6: ，3: 的翻译与7相似，都是将右边的真假出口直接赋值到左边,(5)(4)构成and逻辑运算,(2)(1)构成or逻辑运算,控制语句的翻译,控制语句包括：if 语句 While 语句 Repeat 语句 For 语句,IF语句的翻译,1. IF语句的文法(S是开始符号),产生式(1),(4)生成无else 的IF语句结构产生式(1

22、),(2),(3)生成if then else 的语句结构,（1）SC S(1) （2）Cif E then （3）ST S(2) （4）TC S(1) else,2. IF语句的目标结构及其翻译无else的结构,C.Chain的作用：由于在用第一个产生式进行归约时，只生成了条件式E的代码，then时可以回填E.TC, E.FC必须向后传递到下一各产生式中。,if ab then x:=3;,2. IF语句的目标结构及其翻译有else的结构,if ab then x:=3 else x:=5;,例：将下面的IF语句翻译为四元式序列,if A and B and (CD) thenif AB

23、 then F:=1 else F:=0 else G:=G+1,1.(jnz,A,_,3) /*A的四元式*/ 2.(j,_,_,13) 3.(jnz,B,_,5) /*B的四元式*/ 4. (j,_,_,13) 5.(j,C,D,7) /*CD的四元式*/ 6. (j,_,_,13) 7.(j,A,B,9) /*AB的四元式*/ 8. (j,_,_,11) 9. (:=,1,_,F) /*F :=1的四元式*/ 10. (j,-,-,15) 11. (:=,0,_,F) /*F :=0的四元式*/ 12. (j,_,_,15) 13.(+,G,1,T) /*G:=G+1的四元式*/ 14.

24、(:=,T,_,G) 15.,练习:将下面的语句翻译为四元式序列,if (AC) and (BD) then if A=1 then C:=C+1else if AD then A:=A+2;,1.(j,A,C,3) 2.(j,-,-,14) 3.(j,B,D,5) 4.(j,-,-,14) 5.(j=,A,1,7) 6.(j,-,-,10) 7.(+,C,1,T1) 8.(:=,T,-,C) 9.(j,-,-,14) 10.(j=,A,D,12) 11.(j,-,-,14) 12.(+,A,2,T2) 13.(:=,T2,-,A) 14.,REPEAT语句的翻译,1. 文法描述,2. 目标结

25、构,例： repeat x:=x+1 until x10;,3. 翻译,将下面的语句翻译为四元式序列,If w1 then a:=b*c+d else repeat a:=a-1 until a0;,1.(j,w,1,3) 2.(j, , ,7) 3.(*,b,c,t1) 4.(+,t1,d,t2) 5.(:=,t2, ,a) 6.(j, , ,11) 7.(-,a,1,t3) 8.(:=,t3, , a) 9.(j,a,0, 11) 10.(j, , ,7 ),FOR语句的翻译,1. 文法描述,2. 目标结构,例： for i:=1 to a+b do x:=x+I;,FOR语句的翻译,fo

26、r i:=1 to a+b do x:=x+I;,将下面的语句翻译为四元式序列,for i := a+b*2 to c+d+10 do if hg then p:=p+1;,自顶向下的语法制导翻译,优点：不需要改造文法在需要的任何位置调用语义动作自顶向下的语法分析有两种：递归下降分析 LL(1)分析,递归下降的语法制导翻译,例：对如下文法进行递归下降的分析，并增加语义,只包含两个语句：赋值句和REPEAT语句,需要翻译布尔表达式,主程序：,增加的语义部分,增加的语义部分,用C语言实现repeat(),int *repeats()/* repeat语句的语法制导的翻译过程*/ r_head = nxq; /*记录repeat语句开头的四元式编号*/token= getnexttoken();/*读取下一个token字*/s1_chain = st_sort(token);/*处理repeat后的语句*/token= getnexttoken();if (!strcmp(token ,“;“) /*读到;*/token= getnexttoken();if (strcmp(token,“until“) error(“缺少 until“);/*应为until*/backpatch(/*返回真出口，即repeat语句的下一个语句的四元式编号*/ ,

展开阅读全文

第五章 语义分析和中间代码生成.ppt

第五章语义分析和中间代码生成.ppt