1、 标题: 解读 IEEE标准 754:浮点数表示 解读 IEEE标准 754:浮点数表示如须转载请注明作者为 Lolitalinuxsir.org,并请保持文章的完整和提供转载出处。更新:20060623-06:44 增加了求最大非规格数的公式20060622-23:40 修改了几处笔误,换掉了实验部分的那张大图,改用代码显示。一、背景在 IEEE标准 754之前,业界并没有一个统一的浮点数标准,相反,很多计算机制造商都设计自己的浮点数规则,以及运算细节。那时,实现的速度和简易性比数字的精确性更受重视。直到 1985年 Intel打算为其的 8086微处理器引进一种浮点数协处理器的时候,聪明地
2、意识到,作为设计芯片者的电子工程师和固体物理学家们,也许并不能通过数值分析来选择最合理的浮点数二进制格式。于是 Intel在请加州大学伯克利分校的 William Kahan 教授最优秀的数值分析家之一来为 8087 FPU设计浮点数格式; 而这个家伙又找来两个专家来协助他,于是就有了 KCS组合(Kahn, Coonan, and Stone)。 他们共同完成了 Intel的浮点数格式设计,而且完成地如此出色,以致于 IEEE组织决定采用一个非常接近 KCS的方案作为 IEEE的标准浮点格式。目前,几乎所有计算机都支持该标准,大大改善了科学应用程序的可移植性。二、表示形式从表面上看,浮点数也
3、是一串 0和 1构成的位序列(bit sequence),并不是三头六臂的怪物,更不会咬人。然而 IEEE标准从逻辑上用三元组S,E,M表示一个数 N,如下图所示:N 的实际值 n由下列式子表示:其中: n,s,e,m 分别为 N,S,E,M对应的实际数值,而 N,S,E,M仅仅是一串二进制位。 S(sign)表示 N的符号位。对应值 s满足:n0 时,s=0; n: 5(gdb) x/xw 由 n的计算公式可以求得 n=(-1)0 * 1.25 * 22 = 5, 结果被验证了。 同样,你也可以验证一下十进制浮点数 0.1的二进制形式是否正确,你会发现,0.1 不能表示为有限个二进制位,因此
4、在内存中的表示是舍入(rounding)以后的结果,即 0x3dcccccd, 十进制为 0.100000001, 误差 0.000000001由此产生了。七、未完成关于浮点数,还有很多东西(比如舍入误差、除零异常等等)值得我们深入探讨,但已经无法在此继续。这篇文章的目的仅在初步解释 IEEE标准 754对浮点数的规定以及一些奇妙的地方。写这篇文章花掉了我整天的时间,但也使我彻底记住了以前让我胆怯的东西最重要的是,希望这篇文章对大家有点用处,也算我为计算机科学基础理论版以及 Linuxsir.org做的一点贡献。参考书目:: Randall Hyde, The Art of Assembly
5、Language, Vol.1, 4.2.1: Randal E. Bryant, David R. OHallaron, Computer Systems A Programmers Perspective (Beta Draft), Part, Chapt., 2.4: Rechard Blum, Professional Assembly Language主题词:单片机数制转换器,单片机浮点数转换器人们研制电子计算机的初衷就是为了用于科学计算。时至今日,尽管现在单片机应用领域宽广、色彩缤纷,但复杂计算仍不可或缺的内容。针的对定点数不能胜任复杂计算的缺点,人们在实践中约定了不同格式、不同精
6、度的浮点数,实现了浮点运算。因为计算机只能识别二进制数,完成二进制数的运算,所以我们所说的浮点数一般都是指二进制浮点数。与定点数相比,浮点数能较好地兼顾表达式数值范围,能简捷地表示出很大或很小的数值。浮点由阶码和尾数两部分组成,阶码为带符号的整数,尾数为小于 1带符号的小数(如尾数的绝对值还满足大于或等于 1/2,则称该浮点数为规格化浮点数)。计算过程中主要以足够长的尾数来保证数据的精度,以阶杩来调整数模(绝对值)的大小(即改变小数点的位置),并自动进行符号处理。因此浮点数具有精度高、数的表达范围宽等特点,特别适用于计算过程复杂、精度要求高的场合。目前单片机常用的浮点数格式,不外乎有四种格式:
7、三字节格式、IEEE-754 标准格式、IEEE-754 标准变形 1和 IEEE-754标准变形 2,共 4种格式。作为单片机程序员来说,在编写程序时经常要检验程序中的浮点数运算结果是否正确,但手中又没有合适的检验工具,非常麻烦。对此我就深有体会。为此我收集整理有关浮资料,并编写了一款非常实用的转换工具,它能辅助你编写有关浮点数运算方便的程序,尤其是有关浮点数表格的制作,更是事半功倍。你只需将要转换的十进制定点数编制成一个文本文件,利用 FON浮点数转换器“载入”,如图(2),点击一下转换按钮,顷刻间便可完成一个文件数据的转换。也可将浮点数转换为十进制定点数,即逆转换。FON 浮点数转换器,
8、我也在工作中使用了两年多,效果非常好,为节省了不少时间。下面是浮点数转换器的部分截屏:单个数据转换(图 1)多组数据转换(格式 1)(图 2)多组数据转换(格式 2)(图 3)主要用于制作浮点数表格多组数据逆转换(图 4),此时的定点数会出现此尾数差异,并不影响精度单片机浮点数格式说明 MCS-51 三字节格式:浮点数格式如下:地址 eb BY0 BY1 内容 SEEE EEEE MMMM MMMM MMMM MMMM 用三个字节表示,第一个字节的最高位为数符 S,正数为 0,负数为 1,其余七位为阶码(二进制补码形式);第二字节为尾数的高字节;第三字节为尾数的低字节,尾数用双字节码纯小数(原
9、码)来表示。例:已知 a=-123.4;b=0.7577;c=56.34;d=1.276;用码浮点数表示时,分别为 a=831234H;b=007577H;c=025634H;d=011276H。 MCS-51 三字节浮点数规格化:为了提高运算精度,正数的尾数最高位规定为 1,负数的尾数的最高位规定为 0,这种形式的浮点数为规格化数(又称浮点操作数)。运算之前所有的浮点数都应转成规格化数。* IEEE-754 标准的格式:一个浮点数用两个部分表示,尾数和 2的幂,尾数代表浮点上的实际二进制数,2 的幂代表指数,指数的保存形式是一个 0到 255的 8位值,指数的实际值是保存值(0 到 255)
10、减去 127,一个范围在-127 到+128之间的值,尾数是一个 24位值(代表大约 7个十进制数),最高位 MSB通常是 1,因此省略不保存,一个符号位表示浮点数是正或负。地址 eb BY0 BY1 BY2 内容 SEEEEEEE E.MMMMMMM MMMMMMMM MMMMMMMMS (第 31位)代表符号(数符)位 1是负,0 是正;E 偏移 127的幂,二进制阶码=(EEEEEEEE)-127;. 小数点; M 24位的尾数保存在 23位中,只存储 23位,隐含最高位 1。此方法用最较少的位数实现了较高的有效位数,提高了精度。零是一个特定值,幂是 0 尾数也是 0。阶码的计算方法:阶
11、码采用指数的移码,阶码= 指数 P+7FH 阶码(移码)eb=指数 P+7FH 其中:指数 P=int(Z),Z=ln(A)/ln(2)由 1位符号位、8 位指数、23 位有效数组成。能表示的数据范围为:1.210(-38)3.41038,超出范围为溢出。精度为 2-24 即 5.9 10-8。 -如果 eb=P+7EH,那么指数 P=int(Z)+1 ,(广洲天龙 AVR单片机浮点数格式定义的移码为 7EH,而 IEEE-754标准定义的是 7FH,故我们取移码为7FH)-* 在由二进制浮点数转为十进制定点数时,注意在尾数的左边有一个省略的小数点和 1,这个 1在浮点数的保存中经常省略,但在
12、还原时应加上去。* IEEE-754_1 标准的格式:地址 eb BY0 BY1 BY2 内容 PtEEEEEEE S.MMMMMMM MMMMMMMM MMMMMMMMPt 代表阶符,阶符视阶的正负而定;S 代表符号(数符)位,1 是负,0 是正;. 小数点在数符的右边;E 代表幂偏移,即指数偏差; M 24位的尾数保存在 23位中,只存储 23位,隐含最高位 1。阶码的计算方法:(1)十进制整数(可带小数):阶码 eb=指数 P+7EH 其中:指数 P=int(Z)+1,Z=ln(A)/ln(2)(2)纯小数:阶码 eb=指数+7EH其中:指数 P=int(Z),Z=ln(A)/ln(2)
13、注:IEEE-754_1 主要用于 PIC系列单片机浮点数格式* IEEE-754_2 标准的格式:地址 eb BY0 BY1 BY2 内容 PtEEEEEEE S.MMMMMMM MMMMMMMM MMMMMMMMPt 代表阶符,阶符视阶的正负而定;S 代表符号(数符)位 1是负,0 是正;. 小数点在数符的右边;E 代表幂偏移,即指数偏差; M 24位的尾数保存在 23位中,只存储 23位,隐含最高位 1。阶码采用 1字节移码,以 80H0FFH表示 0127,以 01H7FH表示-127-1。阶码的计算方法:(1)十进制整数(可带小数):阶码 eb=指数 P+80H 其中:指数 P=in
14、t(Z)+1,Z=ln(A)/ln(2)(2)纯小数:阶码 eb=指数+80H其中:指数 P=int(Z),Z=ln(A)/ln(2)能表示的数据范围为:5.810(-39)1.71038,超出范围为溢出。-注:Pt 表示阶符,Pt=0 表示阶码为正数;Pt=1 表示阶码为负数(如 0.1的阶为-3,则 阶码=(-3)+ 80H=7DH )IEEE-754_1与 IEEE-754_2只是阶码字节的内容不同,而尾数的内容是相同的。-例:十进制数 50.265化为 32位规格化浮点数。解 A=50.265,则 Z=ln50.265/ln2,P=int(Z)+1,故 P=6;X=A/2P=50.26
15、5/26=0.785390625,将定点小数:0.785390625 转为二进制数为:1100 1001 0000 1111 0101 1100B, 取其 24位,检查 24位是否为 1,否则,将二进制数左移,直至二进制数的最高位为 1;隐含尾数整数的 1,将二进制数的最高位改为数的数符位(正数为 0,负数为 1)。则:0100 1001 0000 1111 0101 1100B = 49H,0FH,5CH;而阶码 eb=P+80H=6+80H=86H 二进制浮点数为:86H, 49H,0FH,5CH* 浮点 BCD码的格式:浮点码,是以纯小数(原码)来表示。小数点的位置由阶来确定。阶符.阶码
16、,数符.尾数(4 字节),即带符号的阶码与带符号的尾数。阶符:正数为“+”,可隐含;负数为“-”;数符:正数为“+”,可隐含;负数为“-”;阶码:根据小数点的位置来确定。0.1阶符为“+”,数符为“+”,阶为 000.01阶符为“-”,数符为“+”,阶为 0122.00阶符为“+”,数符为“+”,阶为 02-0.1阶符为“+”,数符为“-”,阶为 00-0.01阶符为“-”,数符为“-”,阶为 01-22.00阶符为“+”,数符为“-”,阶为 02阶这里所说的阶是十进制浮点数的阶,即为小数点的位置。“+”阶小数点的位置向右移;“-”阶小数点的位置向左移。 如: 阶符.阶码,数符.尾数-0.01
17、2345678,浮点 BCD码为:-01,-12345780H0.012345678,浮点 BCD码为: -01,12345780H0.12345678,浮点 BCD码为: 00,12345780H12345678,浮点 BCD码为: 08,12345780H-12345678,浮点 BCD码为: 08,-12345780H-注:在单片机编程中定义为:阶符:正阶为 00H,负阶为 FFH数符:正数为 00H,负数为 FFH为了与人们的习惯相一至,在这里仍采用“+,-”号来表示。* 浮点数错误判断及提示:以下是 IEEE-754标准所能表达数据的范围,其它标准请参照,只溢出的范围有所不同而已。F
18、FFFFFFH 不是一个数,提示:“输入有误“7F80000H 正无穷大正溢出,提示:“正溢出“FF80000H 负无穷大负溢出,提示:“负溢出“附注:(1)IEEE 标准是美国电子电气工程师协会定义的国际标准浮点数格式;(2)符号-表示数据的正负,在最高有效位(MSB)。负数的符号位为 1,正数的符号位为 0;(3)有效数字-表示数据的有效数字,反映数据的精度。有效数字一般采用规格化形式,是一个纯小数,所以也被称为尾数、小数或分数。(4)阶码与阶之间的换算公式为:移码(阶码)=补码(阶)+偏移量;阶=移码-偏移量 其中阶又称为指数;移码又称偏移码;80H(或 7FH)为偏移量。*四种浮点数对
19、照表 输入数 据 51 三字节 IEEE-754 标准 IEEE-754_1 IEEE-754_2 0 000000H 00000000H 0000 0000H 0000 0000H 1 018000H 3F800000H 81000000H -1 818000H 81800000H 0.5 008000H 3F000000H 80000000H -0.5 808000H 80800000H 0.1 7DCCCDH 7D4CCCCDH -0.1 FDCCCDH 7DCCCCCDH /180 7B8EFAH 7B0EFA35H Ln 2 00B172H 80317218H 01B505H 813
20、504F3H E 2.7182818 02ADF8H 822DF854H 90 07B400H 87340000H 10 -10 5FDBE7H 5F5BE6FFH 10 10 229503H A21502F9H 88.02969 07B00FH 87300F34H /2 01C910H 81490FDAH 100.25 07C880H 42C88000H 87488000H 50.265 06C90FH 84490F5CH 86490F5CH -5 83A000H C0A00000H 83A00000H -12.5 C1480000H 84C80000H -12.345 C145851EH 2004-08-07 整理