1、Keil C51 精确延时 程序执行时间引言单片机因具有体积小、功能强、成本低以及便于实现分布式控制而有非常广泛的应用领域1。单片机开发者在编制各种应用程序时经常会遇到实现精 确延时的问题,比如按键去抖、数据传输等操作都要在程序中插入一段或几段延时,时间从几十微秒到几秒。有时还要求有很高的精度,如使用单总线芯片 DS18B20时,允许误差范围在十几微秒以内2,否则,芯片无法工作。用51汇编语言写程序时,这种问题很容易得到解决,而目前开发嵌入式系统软件 的主流工具为C语言,用C51写延时程序时需要一些技巧3。因此,在多年单片机开发经验的基础上,介绍几种实用的编制精确延时程序和计算程序执行时间 的
2、方法。实现延时通常有两种方法:一种是硬件延时,要用到定时器/计数器,这种方法可以提高CPU的工作效率,也能做到精确延时;另一种是软件延时,这种方法主要采用循环体进行。1 使用定时器/计数器实现精确延时单片机系统一般常选用11.059 2 MHz、12 MHz或6 MHz晶振。第一种更容易产生各种标准的波特率,后两种的一个机器周期分别为1 s和2 s,便于精确延时。本程序中假设使用频率为12 MHz的晶振。最长的延时时间可达216=65 536 s。若定时器工作在方式2,则可实现极短时间的精确延时;如使用其他定时方式,则要考虑重装定时初值的时间(重装定时器初值占用2个机器周期)。在实际应用中,定
3、时常采用中断方式,如进行适当的循环可实现几秒甚至更长时间的延时。使用定时器/计数器延时从程序的执行效率和稳定性两方面考 虑都是最佳的方案。但应该注意,C51编写的中断服务程序编译后会自动加上PUSH ACC、PUSH PSW、POP PSW和POP ACC语句,执行时占用了4个机器周期;如程序中还有计数值加1语句,则又会占用1个机器周期。这些语句所消耗的时间在计算定时初值时要考虑进去,从初值 中减去以达到最小误差的目的。2 软件延时与时间计算在很多情况下,定时器/计数器经常被用作其他用途,这时候就只能用软件方法延时。下面介绍几种软件延时的方法。2.1 短暂延时可以在C文件中通过使用带_NOP_
4、( )语句的函数实现,定义一系列不同的延时函数,如Delay10us( )、Delay25us( )、Delay40us( )等存放在一个自定义的C文件中,需要时在主程序中直接调用。如延时10 s的延时函数可编写如下:void Delay10us( ) _NOP_( );_NOP_( );_NOP_( );_NOP_( );_NOP_( );_NOP_( );Delay10us( )函数中共用了6个_NOP_( )语句,每个语句执行时间为1 s。主函数调用Delay10us( )时,先执行一个LCALL指令(2 s),然后执行6个_NOP_( )语句(6 s),最后执行了一个RET指令(2 s
5、),所以执行上述函数时共需要10 s。可以把这一函数当作基本延时函数,在其他函数中调用,即嵌套调用4,以实现较长时间的延时;但需要注意,如在Delay40us( )中直接调用4次Delay10us( )函数,得到的延时时间将是42 s,而不是40 s。这是因为执行Delay40us( )时,先执行了一次LCALL指令(2 s),然后开始执行第一个Delay10us( ),执行完最后一个Delay10us( )时,直接返回到主程序。依此类推,如果是两层嵌套调用,如在Delay80us( )中两次调用Delay40us( ),则也要先执行一次LCALL指令(2 s),然后执行两次Delay40us
6、( )函数(84 s),所以,实际延时时间为86 s。简言之,只有最内层的函数执行RET指令。该指令直接返回到上级函数或主函数。如在Delay80s( )中直接调用8次Delay10us( ),此时的延时时间为82 s。通过修改基本延时函数和适当的组合调用,上述方法可以实现不同时间的延时。2.2 在C51中嵌套汇编程序段实现延时在C51中通过预处理指令#pragma asm和#pragma endasm可以嵌套汇编语言语句。用户编写的汇编语言紧跟在#pragma asm之后,在#pragma endasm之前结束。如:#pragma asm汇编语言程序段#pragma endasm延时函数可设
7、置入口参数,可将参数定义为unsigned char、int或long型。根据参数与返回值的传递规则,这时参数和函数返回值位于R7、R7R6、R7R6R5中。在应用时应注意以下几点: #pragma asm、#pragma endasm不允许嵌套使用; 在程序的开头应加上预处理指令#pragma asm,在该指令之前只能有注释或其他预处理指令; 当使用asm语句时,编译系统并不输出目标模块,而只输出汇编源文件; asm只能用小写字母,如果把asm写成大写,编译系统就把它作为普通变量; #pragma asm、#pragma endasm和 asm只能在函数内使用。将汇编语言与C51结合起来,充
8、分发挥各自的优势,无疑是单片机开发人员的最佳选择。2.3 使用示波器确定延时时间熟悉硬件的开发人员,也可以利用示波器来测定延时程序执行时间。方法如下:编写一个实现延时的函数,在该函数的开始置某个I/O口线如P1.0 为高电平,在函数的最后清P1.0为低电平。在主程序中循环调用该延时函数,通过示波器测量P1.0引脚上的高电平时间即可确定延时函数的执行时间。方法 如下:sbit T_point = P10;void Dly1ms(void) unsigned int i,j;while (1) T_point = 1;for(i=0;i2;i+)for(j=0;j124;j+);T_point =
9、 0;for(i=0;i1;i+)for(j=0;j124;j+);void main (void) Dly1ms();把P1.0接入示波器,运行上面的程序,可以看到P1.0输出的波形为周期是3 ms的方波。其中,高电平为2 ms,低电平为1 ms,即for循环结构“for(j=0;j124;j+) ;”的执行时间为1 ms。通过改变循环次数,可得到不同时间的延时。当然,也可以不用for循环而用别的语句实现延时。这里讨论的只是确定延时的方法。2.4 使用反汇编工具计算延时时间对于不熟悉示波器的开发人员可用Keil C51中的反汇编工具计算延时时间,在反汇编窗口中可用源程序和汇编程序的混合代码或
10、汇编代码显示目标应用程序。为了说明这种方法,还使用“for (i=0;iDlyT;i+) ;”。在程序中加入这一循环结构,首先选择build taget,然后单击start/stop debug session按钮进入程序调试窗口,最后打开Disassembly window,找出与这部分循环结构相对应的汇编代码,具体如下:C:0x000FE4CLRA/1TC:0x0010FEMOVR6,A/1TC:0x0011EEMOVA,R6/1TC:0x0012C3CLRC/1TC:0x00139FSUBBA,DlyT /1TC:0x00145003JNCC:0019/2TC:0x00160E INCR
11、6/1TC:0x001780F8SJMPC:0011/2T可以看出,0x000F0x0017一共8条语句,分析语句可以发现并不是每条语句都执行DlyT次。核心循环只有 0x00110x0017共6条语句,总共8个机器周期,第1次循环先执行“CLR A”和“MOV R6,A”两条语句,需要2个机器周期,每循环1次需要8个机器周期,但最后1次循环需要5个机器周期。DlyT次核心循环语句消耗 (2+DlyT8+5)个机器周期,当系统采用12 MHz时,精度为7 s。当采用while (DlyT-)循环体时,DlyT的值存放在R7中。相对应的汇编代码如下:C:0x000FAE07MOVR6, R7/1
12、TC:0x00111F DECR7/1TC:0x0012EE MOVA,R6/1TC:0x001370FAJNZC:000F/2T循环语句执行的时间为(DlyT+1)5个机器周期,即这种循环结构的延时精度为5 s。通过实验发现,如将while (DlyT-)改为while (-DlyT),经过反汇编后得到如下代码:C:0x0014DFFE DJNZR7,C:0014/2T可以看出,这时代码只有1句,共占用2个机器周期,精度达到2 s,循环体耗时DlyT2个机器周期;但这时应该注意,DlyT初始值不能为0。这3种循环结构的延时与循环次数的关系如表1所列。表1 循环次数与延时时间关系单位:s注意:
13、计算时间时还应加上函数调用和函数返回各2个机器周期时间。2.5使用性能分析器计算延时时间很多C程序员可能对汇编语言不太熟悉,特别是每个指令执行的时间是很难记忆的,因此,再给出一种使用Keil C51的性能分析器计算延时时间的方法。这里还以前面介绍的for (i=0;i124;i+)结构为例。使用这种方法时,必须先设置系统所用的晶振频率,选择Options for target中的target选项,在Xtal(MHz)中填入所用晶振的频率。将程序编译后,分别在_point = 1和T_point = 0处设置两个运行断点。选择start/stop debug session按钮进入程序调试窗口,
14、分别打开Performance Analyzer window和Disassembly window。运行程序前,要首先将程序复位,计时器清零;然后按F5键运行程序,从程序效率评估窗口的下部分可以看到程序到了第一个断点,也就是所要算 的程序段的开始处,用了389 s;再按F5键,程序到了第2个断点处也就是所要算的程序段的结束处,此时时间为1 386 s。最后用结束处的时间减去开始处时间,就得到循环程序段所占用的时间为997 s。当然也可以不用打开Performance Analyzer window,这时观察左边工具栏秒(SEC)项。全速运行时,时间不变,只有当程序运行到断点处,才显示运行所用
15、的时间。3 总结本文介绍了多种实现并计算延时程序执行时间的方法。使用定时器进行延时是最佳的选择,可以提高MCU工作效率,在无法使用定时器而又需要实现比 较精确的延时时,后面介绍的几种方法可以实现不等时间的延时: 使用自定义头文件的优点是,可实现任意时间长短的延时,并减少主程序的代码长度,便于对程序的阅读理解和维护。编写延时程序是一项很麻烦的任务,可能需要 多次修改才能满足要求。掌握延时程序的编写,能够使程序准确得以执行,这对项目开发有着重要的意义。本文所讨论的几种方法,都是来源于实际项目的开发经 验,有着很好的实用性和适应性。51单片机中一个比较精确的延时子程序void Delay()unsi
16、gned char a,b,c;for(a=0;a?;a+)for(b=0;b?;b+)for(c=0;c?;c+); 数据表延时时间a值b值c值延时误差10u111-0.520u118030u1115+0.540u219050u1128060u1135+0.570u1142+180u1148090u1155+0.5100u1161-0.5200u111280300u3163+1.5400u211290500u5163+0.5600u61630700u7163-0.5800u13175+0.5900u9163-1.51ms13219-1.52ms23220+33ms33220+3xmsx3220+3 (X的范围为2到255) 基本上我们平时用到的延时都在这里了,每种延时的误差都很小,最大也不过3us,有的甚至没有误差,已经很精确了,如果想延时1秒钟,你可以连续调用延时250ms的程序4次,总共延时误差12us,这样的误差已经不算误差了,用汇编语言编写还达不到这个程度。晶振需要是11.0592M的,单片机的型号影响不大