美文网首页
SVM如何防止过拟合

SVM如何防止过拟合

作者: Arya鑫 | 来源:发表于2017-09-01 08:51 被阅读1410次

SVM如何避免过拟合

过拟合(Overfitting)表现为在训练数据上模型的预测很准,在未知数据上预测很差。过拟合主要是因为训练数据中的异常点,这些点严重偏离正常位置。我们知道,决定SVM最优分类超平面的恰恰是那些占少数的支持向量,如果支持向量中碰巧存在异常点,那么我们傻傻地让SVM去拟合这样的数据,最后的超平面就不是最优的。

如图1所示,深红色线表示我们希望训练得到的最优分类超平面,黑色虚线表示由于过拟合得到的较差的分类面。这是由于蓝色数据中有一个异常点,即图中的那个黑圈蓝点,使得我们的SVM去将就配合它,导致最后得到的分类面(粗黑色虚线)不尽如人意。从间隔可以看出,黑色虚线两边的间隔要比红色线两边的间隔要狭窄,也就是黑色虚线的分类效果比较差。

图1 异常点导致SVM过拟合

解决过拟合的办法是为SVM引入了松弛变量ξ(slack variable),将SVM公式的约束条件改为:

从图2可以看到,引入松弛变量使SVM能够容忍异常点的存在。为什么?因为引入松弛变量后,所有点到超平面的距离约束不需要大于等于1了,而是大于0.8就行了(如果ξ=0.2的话),那么异常点就可以不是支持向量了,它就作为一个普通的点存在,我们的支持向量和超平面都不会受到它的影响。

图 2 松弛变量的作用

我们知道,事物都有两面性,对异常点太容忍会导致任意超平面都可以是“最优”超平面,SVM就失去意义了。因此SVM公示中的目标函数也需要相应修改,我们加上松弛变量的平方和,并求最小值。这样就达到一个平衡:既希望松弛变量存在以解决异常点问题,又不希望松弛变量太大导致分类解决太差。


SVM如何避免过拟合


相关文章

  • SVM如何防止过拟合

    SVM如何避免过拟合 过拟合(Overfitting)表现为在训练数据上模型的预测很准,在未知数据上预测很差。过拟...

  • 防止过拟合

    方法有三: L1和L2正则 Dropout early stop 1. L1和L2正则: 模型权重越小,复杂度越低...

  • 机器学习笔记 - 逻辑回归

    假设公式 损失函数 梯度下降 过拟合 防止过拟合: 梯度下降

  • Task03:动手学深度学习——过拟合和欠拟合、梯度消失和梯度爆

    (学习笔记,待补充)本文目录如下: 1.过拟合和欠拟合1.1过拟合和欠拟合的概念1.2.防止过拟合的方法1.3.防...

  • 无标题文章

    dropout layer的目的是为了防止CNN 过拟合。那么为什么可以有效的防止过拟合呢?首先,想象我们现在只训...

  • 防止过拟合方法

    一、防止过拟合的方法有哪些? 过拟合是指模型参数拟合过程中的问题。由于训练集数据包含抽样误差,复杂模型在进行拟合过...

  • 机器学习实战项目2--防止过拟合&鸢尾花线性回归

    实战项目两个问题如下: 1 如何防止过拟合‘2 使用逻辑回归(Logistic Regression)对鸢尾花数据...

  • 面试经验(机器学习)

    常见分类模型( svm,决策树,贝叶斯等)的优缺点,适用场景以及如何选型 解决过拟合的方法有哪些? KNN(分类与...

  • 正则化防止过拟合

    机器学习中使用「正则化来防止过拟合」到底是一个什么原理?为什么正则化项就可以防止过拟合? 正则化,也叫Reguli...

  • 面试经验(机器学习)

    常见分类模型( svm,决策树,贝叶斯等)的优缺点,适用场景以及如何选型解决过拟合的方法有哪些? KNN(分类与回...

网友评论

      本文标题:SVM如何防止过拟合

      本文链接:https://www.haomeiwen.com/subject/xefqjxtx.html