Float、Double精度计算
二进制存储
浮点数在计算机中采用二进制存储,其中float类型占用4个字节(32位),double类型占用8个字节(64位)。浮点数二进制存储的格式如下:
Untitled.png
其中,符号位s占用1位,指数位e占用8位或11位,尾数位m占用23位或52位。指数位e和尾数位m组合成的数值表示浮点数的大小,而指数位e则表示浮点数的数量级。在计算机中,浮点数采用科学计数法表示,即:
浮点数 = (-1)^s x m x 2^e
float和double的运算
加法运算
两个浮点数相加时,需要先将两个浮点数的指数位对齐,然后将尾数相加,再对结果进行规格化处理。具体步骤如下:
- 将两个浮点数的指数位对齐。对于较小的指数,需要将尾数向右移动(向低位移动)相应的位数,对于较大的指数,需要将尾数向左移动(向高位移动)相应的位数。
- 将尾数相加。尾数相加后,可能会产生进位,需要将进位加到指数位上。
- 对结果进行规格化处理。规格化处理是指将结果的指数位调整到正确的位置,并将尾数的高位进行截断。
减法运算
两个浮点数相减时,需要先将两个浮点数的指数位对齐,然后将尾数相减,再对结果进行规格化处理。具体步骤如下:
- 将两个浮点数的指数位对齐。对于较小的指数,需要将尾数向右移动(向低位移动)相应的位数,对于较大的指数,需要将尾数向左移动(向高位移动)相应的位数。
- 将尾数相减。尾数相减后,可能会产生借位,需要将借位从指数位上减去。
- 对结果进行规格化处理。规格化处理是指将结果的指数位调整到正确的位置,并将尾数的高位进行截断。
乘法运算
两个浮点数相乘时,需要将两个浮点数的指数位相加,然后将尾数相乘,再对结果进行规格化处理。具体步骤如下:
- 将两个浮点数的指数位相加。
- 将尾数相乘。尾数相乘后,需要将结果进行规格化处理,即将指数位调整到正确的位置,并将尾数的高位进行截断。
- 对结果进行规格化处理。规格化处理是指将结果的指数位调整到正确的位置,并将尾数的高位进行截断。
除法运算
两个浮点数相除时,需要将两个浮点数的指数位相减,然后将尾数相除,再对结果进行规格化处理。具体步骤如下:
- 将两个浮点数的指数位相减。
- 将尾数相除。尾数相除后,需要将结果进行规格化处理,即将指数位调整到正确的位置,并将尾数的高位进行截断。
- 对结果进行规格化处理。规格化处理是指将结果的指数位调整到正确的位置,并将尾数的高位进行截断。
BigDecimal的运算
在Java中,float和double类型的浮点数存在精度损失的问题。为了避免这种精度损失,可以使用BigDecimal类进行精度计算。BigDecimal类可以精确表示任意大小的数字,并提供了加、减、乘、除等运算。
public BigDecimal add(BigDecimal augend) {
int diff = this.scale - augend.scale;
if (diff == 0) {
// 如果两个数的scale相等,直接相加,然后返回结果。
long rs = (this.intCompact + augend.intCompact);
if ((this.intCompact ^ rs) >= 0 || (this.intCompact ^ augend.intCompact) < 0)
return new BigDecimal(rs, this.scale);
// 如果相加后有溢出,则需要调用add方法进行运算。
} else {
// 如果两个数的scale不相等,则需要进行scale的调整,然后再相加。
if (diff < 0) {
BigDecimal tmp = this.setScale(augend.scale, RoundingMode.UNNECESSARY);
return new BigDecimal(tmp.intCompact + augend.intCompact, augend.scale);
} else {
BigDecimal tmp = augend.setScale(this.scale, RoundingMode.UNNECESSARY);
return new BigDecimal(this.intCompact + tmp.intCompact, this.scale);
}
}
// 如果没有溢出,则直接调用add方法进行运算。
return new BigDecimal(add(this.intVal, augend.intVal), this.scale);
}
使用场景
- 对于需要高精度计算的业务场景,如金融领域、科学计算等,建议使用BigDecimal进行计算。
- 对于普通的业务场景,如电商、社交等,可以使用float和double进行计算。
网友评论