1、1,第4章 汇编语言程序设计,2,主要内容:,汇编语言源程序的结构 汇编语言语句格式 伪指令 功能调用 汇编语言程序设计,3,4.1 汇编语言源程序机器语言二进制数形式的指令和数据。 B0 64 是什么意思?这就是机器语言。既不直观,又不易理解和记忆.MOV AL,64H ;很容易记忆理解,这就是助记符。助记符用便于记忆的英语单词表示的指令操作码。它反映了指令的功能和主要特征,便于人们理解和记忆。,4,操作数可能放在存储器中,这就涉及操作数的地址。程序中遇到转移指令或调用指令,也需要知道转移地址,若采用具体地址就很不方便,一旦有错,改动也很麻烦。于是人们采用标号或符号来代替地址,例:LP1:
2、mov ax,VARloop LP1汇编语言指令助记符,符号地址,标号,伪指令等语言元素的集合以及这些元素使用的规则。用汇编语言编写的程序叫汇编语言源程序。,指令除了操作码以外,还有一个操作数问题。,5,汇编程序,源程序的编译程序,汇编程序,汇编语言源程序,机器语言目标程序,汇编源程序需翻译成机器语言,变成可执行文件,机器才能执行,这个翻译过程叫汇编。高级语言中称该过程为“解释”或“编译”。执行翻译的程序称为“汇编程序”。,6,汇编语言程序设计与执行过程,输入汇编语言源程序 源文件 .ASM 汇编(编译) 目标文件 .OBJ 链接 可执行文件 .EXE 调试 最终程序,7,汇编语言程序设计流程
3、,编辑程序,Prog.asm 文件,汇编程序,Prog.obj 文件,连接程序,Prog.exe 文件,Edit.exe,Masm.exe,Link.exe,8,4.1.1 汇编语言源程序的结构,汇编语言源程序通常由一个或几个程序模块组成,每个模块一般由三个逻辑段组成:数据段存放数据、变量堆栈段堆栈区域代码段存放程序指令,9,一个基本的汇编语言程序框架如下:stack SEGMENT PARA stackDB 100 DUP(stack)stack ENDSdata SEGMENTdata ENDScode SEGMENTASSUME CS:code, DS:data, ES:datastar
4、t: MOV AX, dataMOV DS, AXMOV ES, AXMOV AL, 4CHINT 21Hcode ENDSEND start,堆栈段,数据段,代码段,10,4.1.2 汇编语言的语句与格式,汇编语言的语句有两种: 指令性语句由8086指令助记符构成的语句 指示性语句由伪指令构成的语句 指令性语句的格式为:标号: 指令助记符 目的操作数,源操作数 ;注释指示性语句的格式为:名字 伪指令 操作数1,操作数2,操作数n ;注释注:各部分之间至少要用一个空格作为分隔符。,11,指令性语句由CPU执行,每一条指令性语句都有一条机器码指令与其对应; 指示性语句由汇编程序执行。它指出汇编程
5、序应如何对源程序进行汇编,如何定义变量、分配存储单元以及指示程序开始和结束等。指示性语句无机器码指令与其相对应。 指令性语句汇编时生成机器码; 指示性语句汇编时不生成机器码。,12,语句的构成元素: 标号指令的符号地址,用来代表指令在存储器中的地址。只能出现在指令性语句中,标号后应加上冒号。 名字段、过程、变量的名字,用来代表它们在存储器中的地址。只能出现在指示性语句中,名字后不加冒号。 指令助记符8086助记符、伪指令 操作数即指令的操作对象 对指令性语句0,1,2个 对指示性语句根据需要而定 操作数之间以逗号分隔 操作数可以是:寄存器、存储单元、常数或表达式例如:AX,DI+BX+10,2
6、00,16*8+TABLE,等等,13,注释以分号开头,可放在指令后,也可单独一行。注意注解的写法。要写指令(段)在程序中的作用,而不要写指令的操作。例如:以下为同一条指令写的注释1)MOV CX,100 ;传送100到CX2)MOV CX,100 ;循环计数器置初值显然,第二种写法要比第一种写法要好。,14,汇编语言的一个实例: hello.asmdata SEGMENT Hello DB Hello, world!,0DH,0AH,$ data ENDS prog SEGMENTASSUME CS:prog,DS:data start: MOV AX,dataMOV DS,AXLEA DX
7、,hello ;取字符串首地址MOV AH,9INT 21H ;显示字符串MOV AH,4CHINT 21H ;退回DOS prog ENDSEND start,名字,标号,15,4.1.3 数据项与表达式,数据项包括常量、变量、标号及表达式。 1.常量 二进制数,以B结尾。如01001101B。 十进制数,如85。 十六进制数,以H结尾。第1个数字为A-F时,前面应加0,如0F160H。 字符串:用引号括起来的1个或多个字符。如ERROR!, a,汇编时被翻译成对应的ASCII码45H,52H,52H,4FH,52H,21H和61H。,16,有三个属性:段地址:即标号所在段的段地址;偏移量:
8、标号所代表存储单元的段内偏移地址;类 型:NEAR或FAR:NEAR表示标号所在语句与转移指令/ 调用指令在同一码段内,跳转时只需改变IP即可。FAR标号所在语句与转移指令/调用指令不在同一代码段内。若没有对类型进行说明,默认为NEAR。 标号通常作为转移指令或CALL指令的转移地址。,2.标号指令所在内存单元的符号地址,17,变量即内存中的存储单元或数据区。变量名是存储单元(数据区)的符号地址或名字。 变量也有三个属性: 段地址变量所在段的段地址 偏移量变量单元地址与段首地址之间的位移量。 类 型有BYTE、WORD和DWORD三种。 变量在程序中作为存储器操作数被引用。,3.变量,18,标
9、号和变量名的使用规则 组成:A-Z(不分大小写), 0-9, ? . _ $ 不能以数字开头,句号(.)只能作为首字符 长度小于31个字符 不能与保留字(指令助记符、伪指令、预定义符号等)重名 不能重复定义 例如:正确的:LP1, AGAIN, NEXT, _GO, OK_1错误的:4M, LOOP, AAA, #HELP, +ONE,19,4.表达式,表达式是常数、寄存器、标号、变量与运算符的组合。 有数字表达式和地址表达式两种。 汇编时按优先规则对表达式进行计算,计算出具体的数值或地址。运行时不能改变。 表达式中的运算符有6类:算术、逻辑、关系、取地址、属性、杂类。,20,用于数字表达式,
10、例:MOV AX,4*1024 汇编后的形式为:MOV AX,4096 用于地址表达式,例:LEA SI,TAB+3 若TAB的偏移地址为1000H,则汇编后的形式为:LEA SI,1003H,1)算术运算符 +、-、*、/,MOD,21,逻辑运算符只能用于数字表达式中。例:MOV CL,36H AND 0FH经汇编后:MOV CL,06H注意,不要把逻辑运算符与逻辑运算指令混淆:例:AND AX, 3FC0H AND 0FF00H汇编后源操作数被翻译为:3F00H,所以上述指令与AND AX, 3F00H等价。,2)逻辑运算符 AND、OR、XOR、NOT,22,关系运算的结果是一个逻辑值:
11、真或假关系为真,结果为全1关系为假,结果为全0例:MOV BX,PORT GT 300H若PORT的值大于300H,则汇编后为:MOV BX,0FFFFH否则汇编后为:MOV BX,0,3)关系运算符EQ、NE、LT、GT、LE、GE,23,SEG:取变量/标号的段地址 OFFSET:取变量/标号的偏移地址 例:VAR DB 12HMOV BX,OFFSET VAR ;取变量VAR的偏移地址 MOV AX,SEG VAR ;取变量VAR的段地址 注意,以下指令的异同:MOV BX, OFFSET VARLEA BX, VAR OFFSET只能取静态的偏移地址; LEA指令即可取静态的偏移地址,
12、也可取动态的偏移地址。,4)取地址运算符SEG、OFFSET,24,TYPE 取变量的类型(1,2,4) LENGTH 取所定义变量的长度(即变量中元素的个数) SIZE 取所定义存储区的字节数(=TYPE*LENGTH) 例:VAR DW 1,2,3,4,5 则 TYPE VAR = 2LENGTH VAR = 5SIZE VAR = 10,5)取值运算符TYPE、LENGTH、SIZE,25,6)属性运算符PTR,用来指定地址操作数的类型。 格式: PTR 类型BYTE, WORD, DWORD, NEAR, FAR BYTE、WORD、DWORD用于描述数据存储单元(变量)地址 NEAR
13、、FAR用于描述转移、调用的目的地址,26,例:MOV BYTE PTRDI,0 ;字节类型MOV WORD PTRDI,0 ;字类型MOV DI,0B5H ;类型不定PTR也可用来进行强制类型转换 例:STR1 DW ? ;STR1定义为字类型 MOV AX,STR1 ;合法MOV AL,STR1 ;非法MOV AL,BYTE PTR STR1 ;合法,27,4.2 伪指令,数据定义伪指令 符号定义伪指令 段定义和段寄存器指定伪指令 过程定义伪指令 结束伪指令,由汇编程序执行的指令,它本身不被汇编成机器指令。常用的伪指令有:,28,4.2.1 数据定义伪指令,用于定义变量,即内存单元或数据区
14、。数据定义伪指令的格式为: 变量名 数据定义伪指令 操作数,操作数, 常用的数据定义伪指令有如下几种:DB 定义字节DW 定义字DD 定义双字 操作数可以是常数、变量或表达式,29,例1: DATA_B DB 10,5,10H DATA_W DW 100H,-4 DATA_D DD 0FFFBH汇编后的内存分配情况 如右图所示。,05H,10H,00H,01H,FCH,FFH,FBH,FFH,00H,00H,0AH,Q,DATA_B,DATA_W,DATA_D,10,5,10H,100H,-4,0FFFBH,30,例2:操作数可以是字符串,例如STR DB HELLO 汇编后的情况如图:,ST
15、R,H,E,L,L,O,注意下面两个定义的不同之处: DB AB ;41H在低字节,42H在高字节 DW AB ;42H在低字节,41H在高字节,48H,45H,4CH,4CH,4FH,31,操作数?用来保留存储空间,但不存入数据. 例3:ABC DB 0,1,2,3,4,OK,$RSV DW ?,?,?,?,?,?,?,?复制操作符DUP: 重复的数据可以使用复制操作符DUP,如上面RSV亦可写成:RSV DW 8 DUP(?) 若操作数中若使用$,则表示的是地址计数器的当前值。,32,例: TABLE DB 10 DUP(?)BUFFER DW TABLE,$+3 设TABLE的偏移地址为
16、0080H,则汇编后如下图所示:,BUFFER,0080H,80H,TABLE,008AH 008BH 008CH 008DH,. . .,8FH,00H,00H,0089H,10 Bytes,33,4.2.2 符号定义伪指令,把一个表达式用一个符号表示,以后凡出现该表达式的地方都可用这个符号表示。类似于C语言中的#define。 符号定义伪指令有两种:EQU,=,用EQU定义的符号未清除前,不能重新定义。清除EQU定义可用PURGE伪指令。 用”=”定义的符号可在任何时候进行重定义。 二者均不占用存储空间,仅是给符号赋值,34,例:FIVE EQU 5COUNT EQU CXTEN EQU
17、10DIST = BYTE PTRSI+BPGOTO = JMP MOV AX, TENMOV CX, COUNTADD DIST, FIVEDIST = WORD PTRSI+BP+1ADD DIST, AXGOTO LABEL,定义,引用,35,4.2.3 段定义伪指令,汇编语言程序是按段来组织程序和数据的。和存储器的物理段相对应,汇编语言程序中的段称为逻辑段。汇编连接后被映射到物理段中。 三类段:代码(程序)、数据、堆栈 段定义伪指令:SEGMENT、ENDS、ASSUME、ORG 定义一个段的基本格式:段名 SEGMENT 定位类型组合方式类别段名 ENDS,36,这两个伪指令总是成对
18、出现,二者前面的段名应一致。SEGMENT说明了一个段的开始,ENDS说明了一个段的结束。 对数据段和堆栈段,段中的语句一般是变量定义。对代码段则是指令语句。 如: code SEGMENTcode ENDS,SEGMENT和ENDS伪指令,37,ASSUME伪指令,在代码段中,还必须明确段和段寄存器的关系,这由ASSUME语句来指定。如ASSUME CS:code, DS:data, ES:data语句中的code和data为段名。这个语句说明:1. CS将指向名字为code的代码段2. DS和ES将指向名字为data的数据段,38,但要注意,ASSUME伪指令只是告知汇编程序有关段寄存器与
19、段的关系,并没有给段寄存器赋予实际的初值。故下面的语句MOV AX,DATAMOV DS,AXMOV ES,AX 将段基址装入段寄存器。 代码段基地址不需要程序员装入CS寄存器,而由OS负责装入。,39,SEGMENT语句后可以带有可选参数,用以规定逻辑段的其他一些属性。,1) 定位类型 说明如何确定逻辑段的边界。有四种: PARA(Paragraph): 逻辑段从一个节 (16个字节) 的边界开始。即段的起始地址应能被16整除, 或这说段起始物理地址应为0H。默认类型 BYTE : 逻辑段从字节边界开始,即段可以从任何地址开始。 WORD : 逻辑段从字边界开始。即段的起始地址必须是偶数。
20、PAGE : 逻辑段从页边界开始。256字节称为一页,故段的起始物理地址应为00H。,40,2) 组合类型 说明不同模块中同名段的组合方式。 PUBLIC : 所有此类型的同名段组合成一个逻辑段,公用一个段地址,运行时装入同一个物理段中。 COMMON : 所有此类型的同名段具有相同的起始地址(覆盖),共享相同的存储区域。 AT : 按绝对地址定位,段地址就是表达式的值。 STACK : 专用于说明堆栈段,组合方式同PUBLIC,41,3) 类别 用单引号括起来的字符串。所有同类别的段被安排在连续的存储区域中。 如:在模块1中有段定义:seg1 SEGMENT PARA STACK stackseg1 ENDS在模块2中有段定义:seg2 SEGMENT PARA STACK stackseg2 ENDS 则连接时这两个段被安排在一起。,42,ORG规定了段内的指令或数据存放的开始地址(偏移地址的初值),其格式为:ORG 表达式的值即为开始地址,从此地址起连续存放程序或数据。 例: ABC SEGMENTORG 100Hbegin: ABC ENDS,ORG伪指令,指令从100H开始存放,43,