C51浮点数显示、浮点数表示方法

C51里用4字节存储一个浮点数,格式遵循IEEE-754标准(详见c51.pdf第179页说明)。一 
个浮点数用两个部分表示,尾数和2的幂,尾数代表浮点上的实际二进制数,2的幂代表指 
数,指数的保存形式是一个0到255的8位值,指数的实际值是保存值(0到255)减去127,一个 
范围在-127到+128之间的值,尾数是一个24位值(代表大约7个十进制数),最高位MSB通常是 
1,因此不保存。一个符号位表示浮点数是正或负。 
浮点数保存的字节格式如下: 
地址        +0          +1           +2           +3 
内容    SEEE EEEE   EMMM MMMM    MMMM MMMM    MMMM MMMM 
这里 
S 代表符号位,1是负,0是正 
E 偏移127的幂,二进制阶码=(EEEEEEEE)-127。 
M 24位的尾数保存在23位中,只存储23位,最高位固定为1。此方法用最较少的位数实现了 
较高的有效位数,提高了精度。 
零是一个特定值,幂是0 尾数也是0。 
浮点数-12.5作为一个十六进制数0xC1480000保存在存储区中,这个值如下: 
地址 +0     +1     +2     +3 
内容0xC1   0x48   0x00   0x00 
浮点数和十六进制等效保存值之间的转换相当简单。下面的例子说明上面的值-12.5如何转 
换。 
浮点保存值不是一个直接的格式,要转换为一个浮点数,位必须按上面的浮点数保存格式表 
所列的那样分开,例如: 
地址       +0           +1            +2            +3 
格式   SEEE EEEE    EMMM MMMM     MMMM MMMM     MMMM MMMM 
二进制  11000001     01001000      00000000      00000000 
十六进制   C1           48            00            00 
从这个例子可以得到下面的信息: 
  符号位是1 表示一个负数 
  幂是二进制10000010或十进制130,130减去127是3,就是实际的幂。 
  尾数是后面的二进制数10010000000000000000000 

在尾数的左边有一个省略的小数点和1,这个1在浮点数的保存中经常省略,加上一个1和小数 
点到尾数的开头,得到尾数值如下: 
1.10010000000000000000000 
接着,根据指数调整尾数.一个负的指数向左移动小数点.一个正的指数向右移动小数点.因为 
指数是3,尾数调整如下: 
1100.10000000000000000000 
结果是一个二进制浮点数,小数点左边的二进制数代表所处位置的2的幂,例如:1100表示 
(1*2^3)+(1*2^2)+(0*2^1)+(0*2^0)=12。 
小数点的右边也代表所处位置的2的幂,只是幂是负的。例如:.100...表示(1*2^(-1))+ 
(0*2^(-2))+(0*2^(-2))...=0.5。 
这些值的和是12.5。因为设置的符号位表示这数是负的,因此十六进制值0xC1480000表示- 
12.5。 
浮点数错误信息 
    8051没有包含捕获浮点数错误的中断向量,因此,你的软件必须正确响应这些错误情 
况。 
    除了正常的浮点数值,还包含二进制错误值。这些值被定义为IEEE标准的一部分并用在 
正常浮点数操作过程中发生错误的时候。你的代码应该在每一次浮点操作完成后检查可能出 
现的错误。 
        名称        值       含义 
        NaN     0xFFFFFFF   不是一个数 
        +INF    0x7F80000   正无穷(正溢出) 
        -INF    0xFF80000   负无穷(负溢出) 
    你可以使用如下的联合体(union)存储浮点数。 
    union f { 
      float          f;  //浮点值 
      unsigned long ul;  //无符号长整数 
    }; 
    这个union包含一个float和一个unsigned long以便执行浮点数**算并响应IEEE错误 
状态。 
     
    以上是KEIL在线帮助的中译文,下面我们讨论如何显示浮点数。 
     
    尾数为24bit,最高可表达的整数值为2^24-1=16777215,也就是说,小于等于16777215 
的整数可以被精确显示。这决定了十进制浮点数的有效位数为7位,10^7<16777215<10^8, 
10的7次方以内的数小于16777215,可以精确表示。使用科学记数法时,整数部分占1位,所 
以小数部分最大占7-1=6位,即最大有6位十进制精度。 
    长整形数和浮点数都占4字节,但表示范围差别很大。浮点数的范围为+-1.175494E-38 
到+-3.402823E+38,无符号长整形数范围为0到4294967295。显示浮点数要用到长整形数保 
存数据,可他们范围差这么多,怎么办呢? 
    仔细观察十进制浮点数的显示,有一个尾数和一个阶码,由上面论证可知32位IEEE-754 
浮点数最大有效数字为7位十进制数,超出此范围的数字有截断误差,不必理会,因此,浮 
点数尾数能够放在长整形数里保存。阶码为-38到38,一个char型变量就可以保存。 
    综上所述,以10^7的最大跨度为窗口(小于10^7也可以,如:10,100...10000等,但决 
不能大于它,那样会超出精度范围),定位浮点数的量级,然后取出7位尾数的整数值存于长 
整形数里,再调整阶码,就可以精确显示此浮点数。 
    量级尺度如下: 
      (-38)-(-35)-(-28)-(-21)-(-14)-(-7)-(0)-(7)-(14)-(21)-(28)-(35)-(38) 
    请严格按照KEIL手册给出的浮点数范围显示,因为数值空间没有完全使用,有些值用于 
错误指示和表示正负无穷。小于1.175494E-38的数仍可以显示一些,但最好不用,以免出 
错。我采用直接判断的方法,剔除此种情况。 
    在计算机里结合律不成立,(a*b)*c!=a*(b*c),原则是先让计算结果值动态范围小的两 
个数运算,请注意程序里的写法。 
    注:(1E38/b)*1E6不要写成1E44/b,因为无法在32位浮点数里保存1E44,切记! 
    计算机使用二进制数计算,能有效利用电子器件高速开关的特性,而人习惯于十进制数 
表示,二进制和十进制没有方便的转换方法,只能通过大量计算实现,浮点数的十进制科学 
记数法显示尤其需要大量的运算,可见,显示一个浮点数要经过若干次浮点运算,没有必要 
就不要显示,否则,花在显示上的时间比计算的耗时都要多得多。

 

转发自:https://blog.csdn.net/liang890319/article/details/12558913?locationNum=15&fps=1

 

笔记:

1、浮点数同样有存储范围的问题,注意幂次。

2、在一定的误差范围内,即可认为两个浮点数相等。

2、浮点数有舍入误差,运算需要严格注意次序,避免精度下降。

posted on 2019-12-15 13:43  TotallyNewUser  阅读(1628)  评论(0编辑  收藏  举报