美文网首页C/C++编程
c++ 浮点数相等判断背后的陷阱和原理

c++ 浮点数相等判断背后的陷阱和原理

作者: 雨幻逐光 | 来源:发表于2019-04-26 13:56 被阅读0次

我们应该注意的是:
在我们的代码中,涉及到浮点数比较的问题,千万不要尝试去比较两数是否相等。
在讲解问题、解决方法以及背后的原理,我们先来看一个例子:

int main()
{
    double epsilon=0.001;
    double d1=2.334;
    double d2=2.335;
    
    cout << "epsilon is: " << epsilon << endl;
    cout << "d2-d1 is: " << d2-d1 << endl;
    
    if ((d2 - d1) == epsilon){
        cout << "Equal!" << endl;
    }
    else{
        cout << "Not equal!" << endl;
    }

    return 0;
}

运行结果如下:

epsilon is: 0.001
d2-d1 is: 0.001
Not equal!
Program ended with exit code: 0

为了理解为什么程序结果和我们的期望不一样,我们再来看看下面的代码以及相应的输出:

int main()
{
    double epsilon=0.001;
    double d1=2.334;
    double d2=2.335;
    
    cout<<"epsilon is: "<< setprecision(20) << epsilon<<endl;
    cout<<"d2-d1   is: "<< setprecision(20) << d2-d1 <<endl;
    
    if ((d2 - d1) == epsilon){
        cout << "Equal!" << endl;
    }
    else{
        cout << "Not equal!" << endl;
    }

    return 0;
}

输出结果如下:

epsilon is: 0.0010000000000000000208
d2-d1   is: 0.00099999999999988986588
Not equal!
Program ended with exit code: 0

从上面我们可以很容易的得知到一个事实:浮点数在计算机中不一定是精确表示的。所以我们得到的结论是:
永远不要尝试去比较两个浮点数是否相等

背后原理机制

根据IEEE(Institute of Electrical and Electronic Engineers )754标准,标准浮点数的格式如下:


其中n是浮点数,s是符号位,m是尾数,e是阶数。
由上面我们可以得知,任何存储在计算机中的浮点数都可以用(-1)s * m * 2e得到。因为二进制数无法精确表示一些十进制数的小数(类似于十进制数无法精确表示0.33333333……无限循环数一样。其中0.33333333333是三进制小数(0.1)3。这也就是很多浮点数在计算机中不能被精确表示的原因。
按照上述原理,我们可以来验证下计算机是否能够精确表示能用整数乘以2的幂表示的十进制数:

int main()
{
    double float_num = 1.5;
    cout << "float_num is: " << setprecision(20) << float_num << endl;
    
    return 0;
}

运行结果如下:

float_num is: 1.5
Program ended with exit code: 0

结果和我们预期的一样。因此我们的结论是:
除了能用2的指数幂乘以整数表示的浮点数能够被精确的表示外,其余的浮点数都是近似表示的。
在c++中,两个浮点数相差在DBL_EPSILON之内的数都认为是相等的:

#include <float.h>
#include <iostream>
using namespace std;

int main()
{
    cout << DBL_EPSILON << endl;
    
    return 0;
}

结果:

2.22045e-16
Program ended with exit code: 0

解决方案

为了避免因为不精确导致的错误,我们可以用容错阈值来解决这个问题:

if (abs(d2 - d1) < epsilon){
        cout << "Equal!" << endl;
    }

或者

if(abs(a - b) <= epsilon * abs(a)){
       cout << "Equal!" << endl;
}

注意:
c++中的abs函数已经被重载,因此可以适用int, long int, float等各种类型。如果是c请调用fabs用于浮点数的绝对值。
上述两种方法中,epsilon为精度值。这个精度值是我们选择来判断两个数是否足够接近以至于可以认为是相等的。
我们不建议用一个常数值来做epsilon。因为随着比较数的改变,epsilon也应该随之改变来适应精度要求。例如我们选择了epsilon = 0.01。当两个比较数的数量级都在109以上但是二者的差值是0.02。0.02对于差值对于两个数而言可以忽略不计,因此二者就是近似相等的。然而依据0.01做判断,二者被判定为不相等。
Doug Gwyn建议用相对差值函数。当两个比较数完全相同时,函数返回值为0。否则函数的返回值是两个差值的绝对值比去两者中较大的数。

#define Abs(x)    ((x) < 0 ? -(x) : (x))
#define Max(a, b) ((a) > (b) ? (a) : (b))

double RelDif(double a, double b)
{
    double c = Abs(a);
    double d = Abs(b);

    d = Max(c, d);

    return d == 0.0 ? 0.0 : Abs(a - b) / d;
}

用法如下:

if(RelDif(a, b) <= TOLERANCE) ...

相关文章

网友评论

    本文标题:c++ 浮点数相等判断背后的陷阱和原理

    本文链接:https://www.haomeiwen.com/subject/ldrfnqtx.html