编写安全代码：小心使用浮点数

作者：gfree.wind@gmail.com
博客：blog.focus-linux.net linuxfocus.blog.chinaunix.net

本文的copyleft归gfree.wind@gmail.com所有，使用GPL发布，可以自由拷贝，转载。但转载请保持文档的完整性，注明原作者及原链接，严禁用于任何商业用途。

======================================================================================================

其实浮点数使用时的注意事项，是一个老生常谈的问题，我本来不想写这个东西的。但是论坛上偶尔还是会有一些朋友问一些浮点的问题，另外前几天写得一篇博文《有趣的问题：C的表达式x==x何时为假》http://blog.chinaunix.net/space.php?uid=23629988&do=blog&id=3126229&cid=565775&comment=true

在那篇文章中，通过x != x为假这一有趣的问题，引出一个特殊的浮点数值NaN。当时我还为了对比浮点与整数的转换，所以使用了memcpy来达到用0xff填充浮点数，来形成NaN。但是在评论中，发现有的朋友反而因为示例中的memcpy而没有注意到重点NaN。

那么今天就重点说一下NaN，并顺带说一下浮点的其它陷阱。

1. 浮点的精度限制。

浮点数的存储格式与整数完全不同。大部分的实现采用的是IEEE 754标准，float类型，是1个sign bit，8 exponent bits，23 mantissa bits。而double类型，是1个sign bit，11 exponent bits，52 mantissa bits。至于浮点如何去表示小数，请自行搜索google。由于float使用的小数表示方法，导致浮点数值是有精度限制的。

有限的精度就引发了浮点数值使用时的两个陷阱。

1）交换定律不适用浮点数

如有三个浮点数float x=1/3，y=1/6，z=1/7，而x*y/z不等于x*(y/z)

#include <stdlib.h>
#include <stdio.h>

int main(void)
{

    float x = 1/3;
    float y = 1/6;
    float z = 1/7;
    if (x*y/z != x*(y/z)) {

        printf("Not equal!\n");
    }
    return 0;

}

编译输出：

[fgao@fgao-vm-fc13 test]$ gcc -g test.c
[fgao@fgao-vm-fc13 test]$ ./a.out
Not equal!

而对于整数来说，如果不发生溢出的情况下，x*y/z是等于x*(y/z)。

2）浮点数的比较要使用范围比较

如：

#include <stdlib.h>
#include <stdio.h>
int main(void)
{

    float x = 0.123-0.11-0.013;
    if (x == 0) {
        printf("x is 0!\n");
    }
    if (-0.0000000001 < x && x < 0.0000000001) {
        printf("x is in 0 range!\n");
    }
    return 0;
}

编译输出：

[fgao@fgao-vm-fc13 test]$ gcc -g test.c
[fgao@fgao-vm-fc13 test]$ ./a.out
x is in 0 range!

这两个都是比较常见的浮点陷阱，下面要说明的是浮点数值的两个exception

1）infinite无限

2）NaN即Not a Number

其中NaN为最为特殊的一个“浮点值”——它不是一个合法的浮点值

在前面的文章中，我使用memcpy构造了一个非法的浮点数值，它导致了x与自身比较的失败。那么，有的朋友会说平时谁会用memcpy去填充浮点啊，那么NaN就离我很远了啊。请看下面的例子：

#include <stdlib.h>

#include <stdio.h>

int main(void)
{
   float x = 1/0.0;
   printf("x is %f\n", x);
   x = 0/0.0;
   printf("x is %f\n", x);
    return 0;
}

编译输出

[fgao@fgao-vm-fc13 test]$ gcc -g test.c
[fgao@fgao-vm-fc13 test]$ ./a.out
x is inf
x is -nan

当1除以0.0时，我们得到的是infinite，而是用0除以0.0时，得到的就是NaN。这里完全是普通的除法运算，也会产生NaN的情况。

那么当使用除法的时候，对除数进行检查，保证其不为0.0是否就可以避免NaN了呢？再看下面的代码：

#include <stdlib.h>
#include <stdio.h>
int main(void)
{
    float x;
    while (1) {

        scanf("%f", &x);

        printf("x is %f\n", x);

    }
    return 0;
}

编译执行

[fgao@fgao-vm-fc13 test]$ ./a.out
inf
x is inf
nan
x is nan

示例代码中，调用scanf来得到用户输入的浮点数。令人惊讶的是，scanf作为C库函数是接受浮点数的这两种exceptions的，用户可以直接输入无限inf和NaN。而C库中究竟有多少种输入输出函数支持这两种exception，我也不知道。那么对于UI程序来说，当遇到浮点数值的时候，我们必须要判断该浮点数是否为一个合法的浮点数，要对用户输入值进行检查，或者说对于一切不属于本模块的浮点输入值都要进行检查。——我在我同事那就遇到一个开源库返回的浮点数为NaN，才引发的前文。

以上面的代码为例，应该为：

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
int main()
{
    float x;
    while (1) {
        scanf("%f", &x);
        if (isinf(x)) {
            printf("It's infinite\n");
        }
        if (isnan(x)) {
            printf("It's NaN\n");
        }
        printf("x is %f, 0x%X\n", x, *(int*)&x);
    }
   return 0;
}

编译运行：

inf
It's infinite
x is inf, 0x7F800000
nan
It's NaN
x is nan, 0x7FC00000

其中isinf和isnan为C库提供的检测函数，分别用于检查infinite和NaN。而isnan实际上就是返回x != x，利用的就是NaN的特性，与任何数值进行相等比较都是返回false。所以当x != x时，即为NaN浮点值。

posted @ 2012-10-05 08:55 璇星阅读(743) 评论(0) 收藏举报

刷新页面返回顶部

编写安全代码：小心使用浮点数

公告