1、书名:数字信号处理技术及其应用 ISBN:7-111-16016-9 作者:刘丽钧 出版社:机械工业出版社 本书配有电子课件,第5章 汇编语言程序设计举例: 5.1 数据块传送例1:将数组X5=1,2,3,4,5初始化.data TAL: .word 1,2,3,4,5.sect “.vectors”B START.bss x,5.text START: STM #x,AR5RPT #4MVPD TAB,*AR5+,例2:编写一段程序将数据存储器中的数组X20复制到数组Y20中。.bss x,20.bss y,20STM #x,AR2STM #y,AR3RPT #19MVDD AR2+,AR3
2、+,5.2 加减法和乘法运算例3:编写完成 Z=X+Y-W的功能LD x,A;直接寻址 ADD y,A SUB w,A; A=A-w STL A, z例4:编程实现 y=mx+b 的功能LD m,T MPY x,A ADD b,A STL A, y,例5:编写实现 y=x1a1+x2 a2的功能LD x1,T MPY a1,B LD x2,T MAC a2,B STL B, y STH B, y+1,例6:找出y=aixi(i=1,2,3,4)中乘机项aixi的最大值,并存入累加器A中。STM #a,AR1STM #x,AR2STM #2,AR3LD *AR1+,TMPY *AR2+,A Lo
3、op1: LD *AR1+,TMPY *AR2+,BMAX ABANZ loop1,*AR3-,5.3 重复操作例7:对一个数组初始化:X5=0,0,0,0,0.bss x,5STM #x,AR1LD #0,ARPT #4STL A,*AR1+或采用如下方法:.bss x,5STM #x,AR1RPTZ A, #4STL A,*AR1+注意:执行重复操作时不响应任何中断,例8:对数组X5中的每个元素加1.bss x,5 Begin: LD #1,16,BSTM #4,BRCSTM #X,AR4RPTB next-1ADD *AR4,16,B,ASTH A,*AR4+ Next: LD #0,B
4、,5.4 程序的控制与转移例9:RC TCCC sub,BNEQBC new,AGT,AOV例10:计算 y= xi(i=15).bss x,5.bss y,1STM #x,AR1STM #4,AR2LD #0,A Loop:ADD *AR1+,ABANZ loop,*AR2-STL A,y,例11: STM #5,AR1STM #10,AR0 Loop: *AR1+CMPR LT,AR1;若(AR1)(AR0),则TC=1BC loop,TC;若TC=1,则转LOOP,5.5 堆栈的使用方法在数据RAM空间开辟一个堆栈区,设置如下:Size .set100 Stack .usect”STK”
5、,sizeSTM #stack+size,SP ,例12:编写实现方程y=mx+b的程序,单操作数法:LD m,TMPY x,AADD b,ASTL A, y,双操作数法:MPY *AR2,*AR3,AADD b,ASTL A, y,5.6 双操作数乘法,例13:编写完成 y=aixi(i=120),采用单操作数方法:LD #0,BSTM,#a,AR2STM #x,AR3STM #19,BRCRPTB done-1 LD *AR2+,T 3T MPY *AR3+,A ADD A,B Done:STH B, ySTL B, y+1,采用双操作数的方法:LD #0,BSTM,#a,AR2STM #
6、x,AR3STM #19,BRCRPTB done-12T MPY *AR2+,AR3+,A ADD A,B Done:STH B, ySTL B, y+1,例14:进一步优化例13的程序:STM #x,AR2 STM #a,AR3 RPTZ A,#19 MAC *AR2+,*AR3+,A STH A,y STL A, y+1,例15 计算 Z32=X32+Y32,标准运算LD xhi, 16,A ADDS xho,A ADD yhi,16,A ADDS yho,A STH A,zhi STL A,zho (6个字,6个T),长字运算DLD xhi,A DADD yhi ,A DSTA,zhi
7、 (3个字,3个T),除DST指令(存储32位数要用E总线2次,需2个机器周期)外, 都是单周期指令,也是在单个周期内同时利用C总线和D总线, 得到32位操作数。,5.7 长字运算和并行运算,并行运算指令有4种:并行加载和乘法指令,并行加载和存 储指令,并行存储和乘法指令,并行存储和加/减法指令。,例16:编写计算 和的程序段.bss x,3.bss d,3STM #x,AR5STM #d,AR2LD #0,ASMADD *AR5+,16,AST *AR5+,16,A|LD *AR2+,BADD *AR2+,16,BSTH B,*AR2,x,y,z,e,d,f,AR5,AR2,例 编写计算Z6
8、4=W64+X64-Y64 的程序段 W、X、Y和结果Z都是64位,它们都由两个32位的长字组成。利用长字指令完成位数的加减法,W3 w2 w1 w0 (W64 ) x3 x2 C x1 x0 (X64 ) y3 y2 C y1 y0 (Y64 )z3 z2 z1 z0 ( Z64 ),低32 位相加产生进位C 低32位相减产生借位C,程序段:DLD w1,A ; A=w1w2DADD x1,A ; A=w1w0+x1x0,产生进位CDLD w3,B ; B=w3w2ADDC x2,B ; B=w3w2+x2+CADD x3,16,B ; B=w3w2+x3x2+CDSUB y1,A ; A=
9、w1w0+x1x0-y1y0,产生借位CDST A,z1 ; z1z0=w1w0+x1x0-y1y0SUBBy2,B ; B=w3w2+x3x2+C-y2-CSUB y3,16,B ; B=w3w2+x3x2+C-y3y2-CDST B,z3 ;z3z2=w3w2+x3x2+C-y3y2-C,32位乘法运算乘法算式如下:x1 x0 S Uy1 y0 S Ux0y0 UUy1x0 SUx1y0 SUY1x1 SSw3 w2 w1 w0 S U U U 其中,S-带符号数,U-无符号数,例18 :编写计算W64=X32*Y32 的程序段STM #x0,AR2 STM #y0,AR3 LD *AR2
10、,T ;T=x0 MPYU AR3+,A ;A=uy0*ux0 STL A w0 ;w0=ux0*uy0 LD A,-16,A ;A=A16 MACSU *AR2+,*AR3-,A ;A+=y1*ux0 MACSU *AR3+,*AR2,A ;A+=x1*uy0 STL A,w1 ;w1=A LD A,-16,A ;A=A16 MAC *AR2,*AR3,A ;A+=x1*y1 STL A,w2 ;w2=A的低16位 STL A,w3 ;w3=A的高16位,5.8 小数运算,1. 小数的表示方法C54X采用2的补码小数,其最高位为符号位数值范围从 -11,一个16位2的补码小数的每一位权值为:
11、一个十进制小数乘以32768之后,将十进制整数部分转换成十六进制数,就得到了这个十进制小数的2的补码表示了。注意:汇编语言程序中,不能直接写入十进制小数。要定义 一个系数0.707,可以写成:word 32768707/1000 不能写成327680.707.,-1 1/2 1/4 1/8 2-15,2. 小数乘法与冗余符号位 出现冗余符号位是两个带符号数相乘,得到的乘积带2个符号位,造成错误的结果。解决冗余符号位的方法:在程序中设定状态寄存器ST1中的FRAT(小数方式)位为1,在乘法器将结果送至累加器时就能自动的左移一位,自动地消去了两个带符号数相乘时产生的冗余符号位。注意:小数乘法编程时
12、,应事先设置FRCT位:SSBX FRCTMPY AR2, *AR3,ASTH A, Z,例19 编写计算 y=ai*xi( i=14) 的程序 其中数据均为小数:a1=0.1 a2=0.2 a3=-0.3 a4=0.4x1=0.8 x2=0.6 a3=-0.4 x4=-0.2.bss x , 4.bss a , 4.bss y , 1.dataTable: .word 1*32768/10.word 2*32768/10.word -3*32768/10.word 4*32768/10.word 8*32768/10.word 6*32768/10.word -4*32768/10.word
13、 -2*32768/10.text,Start: SSBX FRCTSTM #x , AR1RPT #7MVPD table , *AR1STM #x ,AR2STM #a , AR3RPTZ A , #3MAC AR2+, AR3 , ASTH A, y Done: B done,5.9 除法运算,C54X中没有单周期的16位除法指令,利用一条条减法指令(SUBC),加上重复指令RPT #15就可实现两个无符号的除法运算。SUBC Smem ,src ;(src)-(Smem)15ALU输出端;如果ALU输出端0,则(ALU输出 端)1+1src;否则(src)1src 除法运算有两种情况:
14、,1. |被除数|除数|,商为小数 例20: 编写0.4(0.8)的程序段.bss num , 1.bss den , 1.bss quot , 1.data Table : .word 4*32768/10 ;0.4.word -8*32768/10 ;-0.8.text Start : STM #num ,AR1 RPT #1MVPD table ,*AR1 ;传送2个数据至分子、分母单元LD den ,16,A ;将分母移到累加器A(3116)MPYA num ;(num)*(A(3216)B, 获取商的符号(在累加器B中)ABS A ;分母取绝对值,STH A,den ;分母绝对值存放
15、原处 LD num ,16 ,A ;分子A(3216) ABS A ;分子取绝对值 RPT #14 ;15次减法循环,完成除法 SUBC den , A ;如果B0(商是负数),则需要变号 XC 1, BLT NEG A STL A,quot ;保存商,注意:SUBC指令仅对无符号数进行操作,因此事先必须对除数和被除数取绝对值。利用乘法操作,获得商的符号,最后通过条件执行指令给商加上适当的符号。,2. |被除数|除数| ,商为整数 与例 20,除输入数据外,仅有下列改动 LD num ,16 ,A 改成 LD num ,A RPT #14 改成 RPT #15,5.10 浮点运算,为了扩大数据
16、的范围和精度,往往需要采用浮点运算。C54X虽然是个定点DSP器件,但它支持浮点运算。 1. 浮点数的表示方法浮点数用 尾数和指数组成,定点数=尾数2-指数浮点数的尾数和指数可正可负,均用补码表示。指数范围-831。 2. 定点数浮点数通过3条指令实现 (假设定点数已在累加器A中)1)EXP A例22 EXP A执行前 执行后A=FF FFFF FFCB A=FF FFFF FFCBT= 0000 T= 0019(25),例23 EXP B执行前 执行后A=07 8543 2105 A=FF 8543 0000T= 0007 T= FFFC(-4) 2) ST T, EXPONENT这条紧接在
17、XEP后的指令是将保存在T寄存器中的指数存放到数据寄存器的指数单元。 3)NORM A例24 : NORM A执行前 执行后A=FF FFFF F001 A=FF 8008 0000T= 0013 T= 0013(19),例25 : NORM B , A执行前 执行后A=FF FFFF F001 A=FF 4214 1414B=21 0A0A 0A0A B=FF 4214 1414T= FFF9 T= FFF9(-7)注意:NORM指令不能紧跟在EXP指令的后面。3. 浮点数定点数将浮点数转化为定点数时,只要按指数值将其右移(指数为负数时左移)就行了。 4. 浮点数乘法举例见书P229页例26,【例5.26】编写浮点乘法程序,完成x1x20.3(0.8)运算程序中保留10个数据存储单元:,