由于最近在开发交易所,里边涉及到金钱的计算,因此整理了一下单精度、双精度做计算的坑。如果最大值以及最小单位能够确定的话,那么建议将小数计算换成整数计算,比如比特币用int64来表示交易的金额,小数部分通过整数除法换算。
一、IEEE754规定:
1)单精度浮点数字长32位,尾数长度23,指数长度8,指数偏移量127;双精度浮点数字长64位,尾数长度52,指数长度11,指数偏移量1023;
2)约定小数点左边隐含有1位,通常这位数是1,所以上述单精度尾数长度实际为24(默认省略小数点左边的1则为23),双精度尾数长度实际为53(默认省略小数点左边的1则问53);
数符(sign) 阶码(exponent) 尾数(fraction) 总位数 偏移值
单精度 1 8 23 32 127
双精度 1 11 52 64 1023
举例:将176.0625表示为单精度
1)整数部分176转换为二进制为10110000
小数部分.0625转换为二进制为0001
所以176.0625转换为二进制为10110000.0001
2)由于IEEE754约定小数点左边隐含1位,因此1011000.0001 = 1.01100000001 * 2^7
指数偏移为7 + 127 = 134,即10000110
尾数23位,即01100000001000000000000
因此得到IEEE754格式化后的表示0 10000110 01100000001000000000000
(PS:单精度能表达的最大值形式:0 11111111 11111111111111111111111)
二、尾数位数限制带来的精度误差:
无论是整数还是小数都会产生误差。
以单精度整数为例。由于尾数为23位,加上隐含的1位‘1’,因此24位1的二进制表示的十进制为16777215,单精度表示为1001011011111111111111111111111。
那么16777216的二进制为1000000000000000000000000,单精度表示为1001011100000000000000000000000。最后一个0被抛弃,很幸运,此时还是没有误差的。
那么16777217的二进制为1000000000000000000000001,单精度表示为1001011100000000000000000000000。最后一个1被抛弃,此时,产生了误差。
三、为什么不能用float和double做精确计算:
因为尾数位数限制会导致精度误差。
举例如下:
1.内存里实际的值
float c = 5.1;
cout.precision(30); //不设置精度,输出会被四舍五入截断,看上去没有误差了
cout<endl;
输出:5.09999999999999964472863211995
2.整数误差
float d= 16777217;
double dd = d+ 2f;
System.out.println(dd); //输出:1.6777218E7
而我们期望的值是1.6777219E7
3.小数误差
System.out.println(1.1 + 0.8); //输出1.9000000000000001
而我们期望的值是1.9
四、如何做精确计算
原理很简单,就是用字符串做计算,而不是float或者double直接或者间接计算。
Java里可以使用BigDecimal类,c/c++可以使用mpdecimal库。
举例:
会产生误差的直接计算,这种跟直接运算符计算没有差别。如果BigDecimal实现的精度更高,只会减少误差,无法消灭:
BigDecimalb1 = new BigDecimal(v1);
BigDecimalb2 = new BigDecimal(v2);
b1.add(b2).doubleValue();
会产生误差的间接计算,这种依然无法避免16777217这种截断误差:
BigDecimalb3 = newBigDecimal(Float.toString(v1));
BigDecimalb4 = newBigDecimal(Float.toString(v2));
b3.add(b4).doubleValue();
计算过程不会产生误差的方法:
BigDecimal b5 = new BigDecimal(“16777217”);
BigDecimal b6 = new BigDecimal(“2”);
B5.add(b6).doubleValue();
注意:这三种情况最后转换为double的时候都可能产生误差,除非继续转变为字符串使用。
网友评论