1、编译原理实践及应用,-中南大学 肖健宇,2018年10月16日星期二,第2页,教材及主要参考资料,教材:编译原理实践及应用,黄贤英,清华大学出版社 主要参考资料: (1) 编译原理,陈火旺,国防工业出版社 (2)程序设计语言编译方法,肖军模,大连理工大学出版社 (3)编译原理,张素琴,吕映芝,清华大学出版社 (4)编译原理,alfred V.Aho等著,李建中等译,人民邮电出版社,2018年10月16日星期二,第3页,序 言,2018年10月16日星期二,第4页,C语言程序,void main( ) int x,y,z;x=3;y=2;z=x+y; ,什么是编译? 从程序员可以理解的高级语言程
2、序 到机器可以理解的机器语言程序 的自动翻译过程。,2018年10月16日星期二,第5页,汇编语言程序,机器码,2018年10月16日星期二,第6页,为什么要学习编译原理?,1、有助于深刻理解和正确使用程序设计语言,加深对高级语言程序执行过程的理解 2、有助于加深对整个计算机系统的理解。 3、设计开发编译程序的软件技术同样可以用于其他软件的设计开发。 4、随着微处理器技术的飞速发展,处理器性能在很大程度上取决于编译器的质量、编译技术成为计算机的核心技术,地位变得越来越重要。,2018年10月16日星期二,第7页,编译原理课程在计算机科学中的重要地位,(1) 学习编程最初是学习一门高级语言,C或
3、Pascal,掌握编写一些简单程序的方法; (2) 学习数据结构,建立“算法”的概念,对编程有更深入的理解。遇到问题的时候,能够寻找相应的数据结构模型,设计适当的算法来解决问题; (3) 学习汇编语言,这门课程是我们真正深入了解计算机内部工作的第一门课程。通过学习了解汇编语言如何变为机器语言,如何对应于一条指令; (4) 计算机组成原理课程的学习使我们了解到计算机的硬件组成,以及机器指令程序如何在计算机中运行的过程。 (5) 编译原理课程帮助我们了解高级语言程序转换成机器指令程序的过程。可以帮助我们更深刻地理解高级语言程序运行的内部机制。,2018年10月16日星期二,第8页,编译原理课程在计
4、算机科学中的地位,2018年10月16日星期二,第9页,学习本课程的目的和任务,加深对编程语言设计和实现的理解,对和编程语言有关的理论有所了解,对宏观上把握编程语言来说,起一个奠基的作用,提升自身的编程能力 掌握编译程序的基本结构,掌握常用的编译技术和方法,将编译原理的理论和方法应用于一般的软件设计中 培养团队协作能力,2018年10月16日星期二,第10页,本课程的特点,(1) 本课程理论性很强,学习时需要很强的逻辑思维能力 (2) 涉及的算法复杂,要深入地理解这些算法很困难 (3) 编译原理课程各个部分之间的独立性很强,包括词法分析、语法分析、存储的组织与分配、中间语言、语法制导翻译、代码
5、生成与优化这几大部分。词法分析、及语义分析是重点;其他部分相对来说知识性更强一些。,引 论,第一章,2018年10月16日星期二,第12页,本章要求,主要内容:各种翻译程序的概念,编译过程和阶段划分,编译程序的组成和结构,编译程序的构造方法 重点掌握:编译程序工作的基本过程及其各阶段的基本任务,编译程序总框。,2018年10月16日星期二,第13页,问题: 1. 什么是编译程序? 2. 编译程序的工作过程是什么样的? 3. 编译程序的总体结构是什么样的? 4. 什么叫编译前端、编译后端? 5. 什么叫“遍”(pass)? 6. 编译程序有哪些生成方法?,2018年10月16日星期二,第14页,
6、编译程序(Compiler)将高级程序设计语言程序翻译成逻辑上等价的低级语言(汇编语言,机器语言)程序的翻译程序。功能,编译程序,源程序,目标程序,计算机运行,输入数据,结果,1.1 编译程序是什么,2018年10月16日星期二,第15页,计算机中的语言层次和转换关系,2018年10月16日星期二,第16页,解释程序,解释程序(Interpreter)将高级程序设计语言写的源程序作为输入,边解释边执行源程序本身,而不产生目标程序的翻译程序。功能,解释程序,源程序,输入数据,结果,2018年10月16日星期二,第17页,编译程序的分类,诊断编译程序 优化编译程序 可变目标编译程序 交叉编译程序,
7、2018年10月16日星期二,第18页,与编译程序相关的程序,解释程序(Interpreter) 汇编程序(assembler) 连接程序(linker) 连接系统函数与系统资源 装入程序(loader) 重定位(relocation) 预处理器(Preprocessor) 编辑器(editor) Debugger,Profiler,Project Manager,2018年10月16日星期二,第19页,编译原理是讨论编译程序设计的基本理论、基本概念、基本方法,什么是编译原理,2018年10月16日星期二,第20页,1.2 编译过程概述,逻辑上分五个阶段:词法分析、语法分析、语义分析与中间代码
8、生成、代码优化、目标代码生成。每个阶段把源程序从一种表示变换成另一种表示。,编译过程和英文翻译过程对比,把英文翻译为中文 识别出句子中的一个个单词; 分析句子的语法结构; 根据句子的含义进行初步翻译; 对译文进行修饰; 写出最后的译文。,词法分析,语法分析,中间代码产生,优化,目标代码产生,2018年10月16日星期二,第22页,第一阶段:词法分析,任务:从左到右扫描源程序,识别出每个单词 附加任务:a、滤掉空格 b、识别单词 单词符号是语言的基本组成成分 词法分析的工作主要依据语言的词法规则,描述词法规则的有效工具是正规式和有限自动机。,2018年10月16日星期二,第23页,beginre
9、sult:=5B * CB * C end;,例:,2018年10月16日星期二,第24页,第二阶段:语法分析,任务: 在词法分析的基础上,根据语言的语法规则,将单词符号串分解成各类语法短语(例:程序、语句、表达式)。 确定整个输入串是否构成语法上正确的程序。 语法分析所依据的是语言的语法规则,表示语法规则的工具是上下文无关文法,用下推自动机实现。,2018年10月16日星期二,第25页,id1:=int1 + id2 * id3 + id2 * id3,例:识别符号串id1:=int1 + id2 * id3 + id2 * id3(即 result:= 5B * CB * C)是一个赋值语
10、句。,2018年10月16日星期二,第26页,第三阶段:语义分析和中间代码生成,任务:对语法分析所识别出的各类语法范畴分析其含义,进行初步的翻译(翻译成中间代码)。 静态语义审查 变量定义 类型匹配 类型转换例:C:=A*B (检查C与、类型) 中间代码的翻译 中间代码有多种形式,如:四元式: (运算符,运算对象1,运算对象2,结果),2018年10月16日星期二,第27页,例:对赋值语句: id1:=int1 + id2 * id3 + id2 * id31. 检查result、C是否定义类型2. 生成中间代码,(运算符,运算对象1,运算对象2,结果) (*, id2, id3, T1) (
11、+, int1, T1, T2)(*, id2, id3, T3) (+, T2, T3, T4)(:=, T4, _, id1),id1:=int1 + id2 * id3 + id2 * id3,2018年10月16日星期二,第28页,第四阶段: 代码优化,任务:对已产生的中间代码进行加工变换,使生成的目标代码更为高效(时间和空间)。 优化方法包括:公共子表达式的提取、循环优化、删除无用代码等。 代码的优化依据的是程序的等价变换规则。,2018年10月16日星期二,第29页,例:,2018年10月16日星期二,第五阶段:目标代码的生成,任务:把中间代码(或经优化的中间代码)变换成特定机器上
12、的低级语言代码。 依赖于机器的硬件系统结构和机器指令的含义 目标代码可以是:绝对指令代码、可重定位的指令代码、汇编指令代码,2018年10月16日星期二,第31页,第31页,例:,2018年10月16日星期二,第32页,1.3 编译程序的结构,2018年10月16日星期二,第33页,2018年10月16日星期二,第34页,几个概念 符号表:登记源程序中出现的名字以及名字的各种属性。 遍:对源程序或源程序的中间结果从头到尾扫描一次,并作有关的加工处理,生成新的中间结果或目标程序。 编译前端:主要指与源语言有关,与目标语言无关的部分,通常包括词法分析、语法分析、语义分析和中间代码生成,与机器无关部
13、分的代码优化。 编译后端:指与目标机器有关的部分。如与机器有关的优化、目标代码生成。,2018年10月16日星期二,第35页,编译阶段的组合,2018年10月16日星期二,第36页,为什么要生成中间代码,2018年10月16日星期二,第37页,(1) 记号(token)当扫描程序将字符收集到一个记号中时,它通常是以符号表示这个记号;这也就是说,作为一个枚举数据类型的值来表示源程序的记号集。,编译程序中的主要数据结构:,2018年10月16日星期二,第38页,(2) 语法树(syntax tree)如果分析程序确实生成了语法树,它的构造通常为基于指针的标准结构,在进行分析时动态分配该结构,则整棵
14、树可作为一个指向根节点的单个变量保存。结构中的每一个节点都是一个记录,它的域表示由分析程序和之后的语义分析程序收集的信息。,2018年10月16日星期二,第39页,(3) 符号表(symbol table)这个数据结构中的信息与标识符有关:函数、变量、常量以及数据类型。符号表几乎与编译器的所有阶段交互:扫描程序、分析程序或将标识符输入到表格中的语义分析程序;语义分析程序将增加数据类型和其他信息;优化阶段和代码生成阶段也将利用由符号表提供的信息选出恰当的代码。因为对符号表的访问如此频繁,所以插入、删除和访问操作都必须比常规操作更有效。尽管可以使用各种树的结构,但杂凑表却是达到这一要求的标准数据结
15、构。有时在一个列表或栈中可使用若干个表格。,2018年10月16日星期二,第40页,(4) 常数表(literal table)常数表的功能是存放在程序中用到的常量和字符串,因此快速插入和查找在常数表中也十分重要。但是,在其中却无需删除,这是因为它的数据全程应用于程序而且常量或字符串在该表中只出现一次。,2018年10月16日星期二,第41页,(5) 中间代码(intermediate code)根据中间代码的类型(例如三元式代码)和优化的类型,该代码可以是文本串的数组、临时文本文件或是结构的连接列表。对于进行复杂优化的编译器,应特别注意选择允许简单重组的表示。,2018年10月16日星期二,
16、第42页,(6) 临时文件(t e m p o r a ry file)计算机过去一直未能在编译器时将整个程序保留在存储器中。这一问题已经通过使用临时文件来保存翻译时中间步骤的结果或通过“匆忙地”编译(也就是只保留源程序早期部分的足够信息用以处理翻译)解决了。,2018年10月16日星期二,第43页,1.4 构造编译程序,一般生成编译程序的方法有: 1.直接用机器语言编写编译程序 2.用汇编语言编写编译程序 3.用高级语言编写编译程序 4.用编译工具自动生成:LEX(词法分析)与YACC(用于自动产生LALR分析表) 5.移植(同种语言的编译程序在不同类型的机器之间移植),2018年10月16日星期二,第44页,本书构成,2018年10月16日星期二,第45页,思考题,1. 什么是编译程序 ? 2. 编译过程分哪些阶段?各阶段的功能和任务是什么? 3. 写出pascal语言中字符集、单词、数据类型、各种表达式、语句和程序的组成4. 查阅如下一种资料: (1) 与某种语言(如java、VB等)的编译程序有关 (2) 与编译程序的理论有关 (3) 与某种高级语言的发展有关5. 用某种熟悉的语言的编译程序来理解层次和遍,