转载:https://github.com/camsong/blog/issues/9
大家在使用JavaScript 进行浮点数运算时会遇到一下问题 :
consle.log(0.1+0.2 === 0.3) // 此时打印false
很多人知道这是浮点数误差问题,接下来让我们一起看下为什么会遇到这种问题以及相关的解决方案。还会向你解释JS中的大数危机和四则运算中会遇到的坑。
浮点数的存储
JavaScript 中所有数字包括整数和小数对应的都是Number
类型。它的实现遵循 IEEE 754 标准,使用 64 位固定长度来表示也就是标准的 double 双精度(16个字节)浮点数进行存储。
这样的存储结构优点是可以归一化处理整数和小数,节省存储空间。
64位比特又可分为三个部分:
- 符号位S:第 1 位是正负数符号位(sign),0代表正数,1代表负数
- 指数位E:中间的 11 位存储指数(exponent),用来表示次方数
- 尾数位M:最后的 52 位是尾数(mantissa),超出的部分自动进一舍零
以上的公式遵循科学计数法的规范,由于我们是二进制存储,所以0<M<2
。也就是说整数部分只能是1,所以可以被省略,只保留后面的小数部分。如 4.5 转换成二进制就是 100.1,科学计数法表示是 1.001*2^2,舍去1后 M = 001
。E是一个无符号整数,因为长度是11位,取值范围是 0~2047(当这11位都是1的时候计算出最大值2^11-1)。但是科学计数法中的指数是可以为负数的,所以再减去一个中间数 1023,[0,1022]表示为负,[1024,2047] 表示为正。如4.5 的指数E = 1025
,尾数M为 001。
最终的公式变成:
latex expression所以 4.5
最终表示为(M=001、E=1025):
(图片由此生成 http://www.binaryconvert.com/convert_double.html)
为什么 0.1+0.2!==0.3
?
计算步骤为:
// 0.1 和 0.2 都转化成二进制后再进行运算
0.00011001100110011001100110011001100110011001100110011010 +
0.0011001100110011001100110011001100110011001100110011010 =
0.0100110011001100110011001100110011001100110011001100111
// 将其转成十进制是 0.30000000000000004 而非 0.3
为什么 x=0.1
能得到 0.1
?
恭喜你到了看山不是山的境界。因为 mantissa 固定长度是 52 位,再加上省略的一位(值为1),可以表示的最大安全数是 2^53-1=9007199254740991
,对应科学计数尾数是 9.007199254740991
,这也是 JS 最多能表示的精度。它的长度是 16,所以可以使用 toPrecision(16)
来做精度运算,超过的精度会自动做凑整处理。于是就有:
0.10000000000000000555.toPrecision(16)
// 返回 0.1000000000000000,去掉末尾的零后正好为 0.1
// 但你看到的 `0.1` 实际上并不是 `0.1`。不信你可用更高的精度试试:
0.1.toPrecision(21) = 0.100000000000000005551
上面说到一个概念最大安全数,当我们把52位尾数全部填充为1
,之后再加上之前省略的一位,即有53个1,那么可表示的最大数是2^53-1
,那么如果超过了会怎么样?
Math.pow(2,53) // 9007199254740992
Math.pow(2,53)+1 // 9007199254740992
Math.pow(2,53)+2 //9007199254740994
Math.pow(2,53)+3 //9007199254740996
Math.pow(2,53)+4 //9007199254740996
Math.pow(2,53)+5 //9007199254740996
可以看到超出范围就会出现整数和双精度浮点数不一一对应的情况!!
大数危机
可能你已经隐约感觉到了,如果整数大于 9007199254740991 会出现什么情况呢?
由于 E 最大值是 1023,所以最大可以表示的整数是 2^1024 - 1
,这就是能表示的最大整数。但你并不能这样计算这个数字,因为从 2^1024
开始就变成了 Infinity
> Math.pow(2, 1023)
8.98846567431158e+307
> Math.pow(2, 1024)
Infinity
那么对于 (2^53, 2^63)
之间的数会出现什么情况呢?
-
(2^53, 2^54)
之间的数会两个选一个,只能精确表示偶数 -
(2^54, 2^55)
之间的数会四个选一个,只能精确表示4个倍数 - ... 依次跳过更多2的倍数
下面这张图能很好的表示 JavaScript 中浮点数和实数(Real Number)之间的对应关系。我们常用的 (-2^53, 2^53)
只是最中间非常小的一部分,越往两边越稀疏越不精确。
要想解决大数的问题考虑兼容性问题你可以引用第三方库 bignumber.js,原理是把所有数字当作字符串,但是性能会差很多。否则可以使用新引入的基础类型BigInt
。要注意的是这样能保持精度但运算效率会降低。
toPrecision
vs toFixed
数据处理时,这两个函数很容易混淆。它们的共同点是把数字转成字符串供展示使用。注意在计算的中间过程不要使用,只用于最终结果
。
不同点就需要注意一下:
-
toPrecision
是处理精度,精度是从左至右第一个不为0的数开始数起。 -
toFixed
是小数点后指定位数取整,从小数点开始数起。
两者都能对多余数字做凑整处理,也有些人用 toFixed
来做四舍五入,但一定要知道它是有 Bug 的。
如:1.005.toFixed(2)
返回的是 1.00
而不是 1.01
。
原因: 1.005
实际对应的数字是 1.00499999999999989
,在四舍五入时全部被舍去!
解法:使用专业的四舍五入函数 Math.round()
来处理。但 Math.round(1.005 * 100) / 100
还是不行,因为 1.005 * 100 = 100.49999999999999
。还需要把乘法和除法精度误差都解决后再使用 Math.round
。可以使用后面介绍的 number-precision#round
方法来解决。
解决方案
回到最关心的问题:如何解决浮点误差。首先,理论上用有限的空间来存储无限的小数是不可能保证精确的,但我们可以处理一下得到我们期望的结果。
数据展示类
当你拿到 1.4000000000000001
这样的数据要展示时,建议使用 toPrecision
凑整并 parseFloat
转成数字后再显示,如下:
parseFloat(1.4000000000000001.toPrecision(12)) === 1.4 // True
封装成方法就是:
function strip(num, precision = 12) {
return +parseFloat(num.toPrecision(precision));
}
为什么选择 12
做为默认精度?这是一个经验的选择,一般选12就能解决掉大部分0001和0009问题,而且大部分情况下也够用了,如果你需要更精确可以调高。
数据运算类
对于运算类操作,如 +-*/
,就不能使用 toPrecision
了。正确的做法是把小数转成整数后再运算。以加法为例:
/**
* 精确加法
*/
function add(num1, num2) {
const num1Digits = (num1.toString().split('.')[1] || '').length;
const num2Digits = (num2.toString().split('.')[1] || '').length;
const baseNum = Math.pow(10, Math.max(num1Digits, num2Digits));
return (num1 * baseNum + num2 * baseNum) / baseNum;
}
以上方法能适用于大部分场景。遇到科学计数法如 2.3e+1
(当数字精度大于21时,数字会强制转为科学计数法形式显示)时还需要特别处理一下。
能读到这里,说明你非常有耐心,那我就放个福利吧。遇到浮点数误差问题时可以直接使用
https://github.com/dt-fe/number-precision
完美支持浮点数的加减乘除、四舍五入等运算。非常小只有1K,远小于绝大多数同类库(如Math.js、BigDecimal.js),100%测试全覆盖,代码可读性强,不妨在你的应用里用起来!
网友评论