浮点数比较的精度问题
1 引言
先举个例子:
c != 0.3
a,b,c局部变量值
如果变量 a , b 换 0.75 , 0.5 可以看出运行出 c == 1.25 ,说明浮点数运算是不稳定的。
a=0.5,b=0.75,c == 1.25
为什么会时好时坏,因为不是所有的小数能用浮点数标准 ( IEEE 754 ) 表示出来。
所以,判断两个浮点数变量是否相等,不能简单地通过 "==" 运算符实现,浮点数进行比较时,一般比较他们之间的差值在一定范围之内。
FLT_EPSILON
数值是 1.192092896e-07F
,最小的 float 型数,它使 1.0+FLT_EPSILON !=1.0
2 为什么浮点数精度会丢失
十进制小数转化为二进制数:乘以2直到没有了小数为止。
举个例子,0.9 表示成二进制数。
很显然,小数的二进制表示有时是不可能精确的。其实道理很简单,十进制系统中能不能准确表示出 2/3 呢?同样二进制系统也无法准确表示 1/10 。这也就解释了为什么浮点型精度丢失问题。
3 float 存储原理
float 型在内存中占 4 个字节。float 的 32 个二进制位结构如下:
float 内存存储结构
313029----2322----0实数符号位指数符号位指数位有效数位
其中符号位 1 表示正,0 表示负。有效位数位 24 位,其中一位是实数符号位。
将一个 float 型转化为内存存储格式的步骤为:
先将这个实数的绝对值化为二进制格式,注意实数的整数部分和小数部分的二进制方法在上面已经探讨过了。
将这个二进制格式实数的小数点左移或右移 n 位,直到小数点移动到第一个有效数字的右边。
从小数点右边第一位开始数出二十三位数字放入第 22 到第 0 位。
如果实数是正的,则在第 31 位放入“0”,否则放入“1”。
如果 是左移得到的,说明指数是正的,第 30 位放入“1”。如果 n 是右移得到的或 n=0,则第 30 位放入“0”。
如果 n 是左移得到的,则将 n 减去 1 后化为二进制,并在左边加“0”补足七位,放入第 29 到第 23 位。如果n是右移得到的或 n=0,则将 n 化为二进制后在左边加“0”补足七位,再各位求反,再放入第 29 到第 23 位。
0.2356 的内存存储格式:
将 0.2356 化为二进制后大约是0.00111100010100000100100000。
将小数点右移三位得到1.11100010100000100100000。
从小数点右边数出二十三位有效数字,即11100010100000100100000放 入第 22 到第 0 位。
由于 0.2356 是正的,所以在第 31 位放入“0”。
由于我们把小数点右移了,所以在第 30 位放入“0”。
因为小数点被右移了 3 位,所以将 3 化为二进制,在左边补“0”补足七位,得到0000011,各位取反,得到1111100,放入第 29 到第 23 位。
最后表示0.2356为:0 0 1111100 11100010100000100100000
浮点类型标识的有效数字及数值范围
Float :比特数为 32 ,有效数字为 6-7 ,数值范围为
-3.4E+38~3.4E+38
Double :比特数为 64 ,有效数字为 15-16 ,数值范围为
-1.7E-308~1.7E+308
版权声明: 本文为 InfoQ 作者【C语言与CPP编程】的原创文章。
原文链接:【http://xie.infoq.cn/article/d1450036ae39f89b13c971a2f】。文章转载请联系作者。
评论