美文网首页
ML - 回归中的相关度和R平方值

ML - 回归中的相关度和R平方值

作者: leo567 | 来源:发表于2018-12-25 10:53 被阅读9次
    1. 皮尔逊相关系数 (Pearson Correlation Coefficient):

    1.1 衡量两个值线性相关强度的量

    1.2 取值范围 [-1, 1]:

    正向相关: >0, 负向相关:<0, 无相关性:=0

    1.3




    2. 计算方法举例:

    | X | Y |
    | 1 | 10 |
    | 3 | 12 |
    | 8 | 24 |
    | 7 | 21 |
    | 9 | 34 |

    import numpy as np
    import math
    
    def computeCorrelation(X, Y):
        xBar = np.mean(X)
        yBar = np.mean(Y)
        SSR = 0
        varX = 0
        varY = 0
        for i in range(0, len(X)):
            diffXXBar = X[i] - xBar
            diffYYBar = Y[i] - yBar
            SSR += (diffXXBar * diffYYBar)
            varX += diffXXBar ** 2
            varY += diffYYBar ** 2
    
        SST = math.sqrt(varX * varY)
        return SSR / SST
    
    
    testX = [1, 3, 8, 7, 9]
    testY = [10, 12, 24, 21, 34]
    
    print (computeCorrelation(testX, testY))
    # 0.94031007654487
    

    3. 其他例子:


    4. R平方值:

    4.1定义:决定系数,反应因变量的全部变异能通过回归关系被自变量解释的比例。

    4.2 描述:如R平方为0.8,则表示回归关系可以解释因变量80%的变异。换句话说,如果我们能控制自变量不变,则因变量的变异程度会减少80%

    4.3: 简单线性回归:R^2 = r * r

    多元线性回归:




    5. R平方也有其局限性:R平方随着自变量的增加会变大,R平方和样本量是有关系的。因此,我们要到R平方进行修正。修正的方法:


    相关文章

      网友评论

          本文标题:ML - 回归中的相关度和R平方值

          本文链接:https://www.haomeiwen.com/subject/bjbxlqtx.html