美文网首页
10.应用机器学习的建议(Advice for applying

10.应用机器学习的建议(Advice for applying

作者: justinwei | 来源:发表于2019-03-19 18:41 被阅读0次

第六周 lecture 10

对于一个线性回归
J(\theta)=\frac1{2m}[\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}) + \lambda\sum_{j=1}^n\theta_j ]

当发现预测值不对时,可能的步骤包括以下:

  • 获得更多的训练数据 (Get more training examples) - 欠拟合
  • 尽量减少特性(try smaller sets of features) - 过拟合
  • 得到更多的特性(try getting additional features) - 欠拟合
  • 增加特性的阶 (try adding polynomial features(x_1^2,x_2^2,x_1x_2),etc) - 欠拟合
  • 增加\lambda (try decreasing\lambda ) - 过拟合
  • 减小\lambda (try increasing\lambda ) - 欠拟合
  1. 评估假设(Evaluation a hypothesis)
    1).将数据集按以下比例分拆:
数据占比 描述
60% 训练集Training set
20% 验证集 cross validation set
20% 测试集 test set

2). 误差(error)计算
J_{train}(\theta)=\frac1{2m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2
交叉验证误差(cross validation error)
J_{cv}(\theta) = \frac1{2m_{cv}}\sum_{i=1}^{m_{cv}}(h_\theta(x_{cv}^{(i)})-y_{cv}^{(i)})^2
3). 误差分析

  • 偏差大/欠拟合(bias/under-fit)
  • 过拟合(variance)
  • 多项式的阶数 (degrees of polynomial)


    多项式的阶数vs误差
    $\lambda$vs误差
  1. 学习曲线(Learning curves)
    高偏差曲线(High bias), 增加训练数据量无法解决欠拟合问题。


    高偏差曲线

    过拟合(High variance) 增加训练数据量可以解决问题过拟合的问题。


    High variance
  2. 神经网络与过拟合(neural networks and overfitting)
  • 更小的神经网络(更少的参数;更倾向欠拟合)
  • 更大的精经网络(更多的参数;更倾向过拟合),增加\lambda值解决过拟合。
    神经网络与过拟合

相关文章

网友评论

      本文标题:10.应用机器学习的建议(Advice for applying

      本文链接:https://www.haomeiwen.com/subject/dienmqtx.html