美文网首页
Intel-ML笔记02 训练集分割验证&线性规划

Intel-ML笔记02 训练集分割验证&线性规划

作者: SilentDawn | 来源:发表于2018-05-25 10:01 被阅读0次

    欠拟合(Underfitting)和过拟合(Overfitting)

    欠拟合:拟合函数与训练集误差较大
    过拟合:拟合函数与训练集完美匹配


    underfitting vs overfitting.png

    偏差(Bias)和方差(Variance)平衡

    偏差:与真实值的偏离程度
    方差:真实值与期望值之间距离的波动程度


    Bias-Variance Tradeoff.png

    训练集和测试集

    将数据分割为训练集和测试集,训练集用户训练模型,测试集用于对训练的模型进行测试

    交叉验证(cross validation)

    在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。

    • 训练误差和验证误差


      error.png

    线性规划(Linear Regression)

    • 线性规划


      Linear Regresssion.png
    • 残差(residuals)


      Redisuals.png
    • 均方误差(mean squared error)


      mean squared error.png
    • 最小均方误差


      minimum mean squared error.png
    • 成本函数


      cost function.png
    • 其他衡量错误的方式

      • Sum of Squared Error(SSE)


        SSE.png
      • Total Sum of Squares(TSS)


        TSS.png
        • Correlation Coefficient(R2)


          R2.png

    线性规划与KNN对比

    compare LR and KNN.png

    特征缩放

    缩放是对特征的变换。
    线性规划模型的预测假设残差是正态分布的,但通常是偏斜的,因此使用缩放解决该问题。


    feature type.png

    相关文章

      网友评论

          本文标题:Intel-ML笔记02 训练集分割验证&线性规划

          本文链接:https://www.haomeiwen.com/subject/jyhyjftx.html