1、一、实验目的和要求:设计并实现一个 PL/0 语言(或其它语言,如 C 语言) 的词法分析程序,加深对词法分析原理的理解。二、实验原理:词法分析是从左向右扫描每行源程序的符号,拼成单词,换成统一的机内表示形式TOKEN 字,送给语 法分析程序。TOKEN 字是一个二元式:(单词种别码,自身值)。 PL/0语言单词的种别码参见教材(或自行设定),单词 自身值按如下规则给出:1 标识符的自身值是它在符号表的入口地址。2 常数的自身值是常数本身(或它的二进制数值)。3 关键字和界限符的自身值为本身。三、 实验步骤与要求1、设计的词法分析器符合软件工程的要求。2、 编制程序,此程序应具有如下功能: 1
2、)输入:字符串(待进行词法分析的源程序),输出:由(种别码,自身值)所组成的二元组序列。2) 功能:a. 滤空格b. 识别保留字c. 识别标识符d. 拼数e. 拼复合单词: 例如: =、 = ; ( ) #(3):其他单词是标识符(ID)和整型常数(NUM ),通过以下正规式定义:ID=letter(letter | digit)*NUM=digit digit*(4)空格由空白、制表符和换行符组成。空格一般用来分隔 ID、NUM 、运算符、界符和关键字,词法分析阶段通常被忽略。、设计的词法分析器符合软件工程的要求。2、 编制程序,此程序应具有如下功能: 4)输入:字符串(待进行词法分析的源程
3、序),输出:由(种别码,自身值)所组成的二元组序列。5) 功能:f. 滤空格g. 识别保留字h. 识别标识符i. 拼数j. 拼复合单词: 例如: =、 )syn=21;tokenm+=ch;else if(ch=)syn=22;tokenm+=ch;elsesyn=20;ch=progp-;break;case:m=0;tokenm+=ch;ch=progp+;if(ch=)syn=24;tokenm+=ch;elsesyn=23;ch=progp-;break;case:m=0;tokenm+=ch;ch=progp+;if(ch=)syn=18;tokenm+=ch;elsesyn=17;
4、ch=progp-;break;case10:syn=12;token0=n;break;case11:syn=12;token0=n;break;case+:syn=13;token0=ch;break;case-:syn=14;token0=ch;break;case*:syn=15;token0=ch;break;case/:syn=16;token0=ch;break;case=:syn=25;token0=ch;break;case;:syn=26;token0=ch;break;case(:syn=27;token0=ch;break;case):syn=28;token0=ch;
5、break;case#:syn=0 ;token0=ch;break;default:syn=-1;main()printf(“nn对应信息:n“1.1-6为关键字n“2.10-11为字符或常量n“3.12-28为表示符n“);p=0;printf(“nplease input string:n“);do ch=getchar();progp+=ch;while(ch!=#);p=0;doscaner();switch(syn)case 11: printf(“(%d,%d)n“,syn,sum);break;case -1: printf(“n ERROR;n“);break;default
6、: printf(“(%d,%s)n“,syn,token);while(syn!=0);getch();四、实验结果及总结:输出:对应信息:1.1-6为关键字2.10-11为字符或常量3.12-28为表示符please input string:int i = 0; if(i=3) i+; end#(10,int)(10,i)(25,=)(11,0)(26,;)(2,if)(27,()(10,i)(25,=)(25,=)(11,3)(28,)(10,i)(13,+)(13,+)(26,;)(6,end)(0,#)总结:通过该实验,主要有以下几方面收获:一、 对实验原理有更深的理解。二、对词法分析在实践中的应用有深刻的理解。在实践的基础上,把所学过的知识应用于实际应用,更深刻的理解了词法分析以及编译原理的实际应用。