超平面用方程表示为 图中红色样本是被分错的
前面介绍的支持向量机形式是要求所有样本均满足约束, 即所有样本都必须划分正确,这称为"硬间隔" (hard margin),而软间隔则是允许某些样本不满足约束。当然我们是希望这样不满足约束的样本越少越好。因此目标函数定义为
,其中
由于非凸、非连续,常用其他损失函数替代,如下图所示:
采用hinge损失得到:
落入间隔带的样本被认为是预测正确的
目标函数:
可允许间隔带两侧的松弛程度有所不同,故引入松弛变量 和 ,得到SVR问题:
拉格朗日乘子法
,求极值,令
代入L,得到SVR的对偶问题:
KKT条件为:
当且仅当,为非零;当且仅当,为非零.换言之,样本没有落在-间隔带时,和为非零。此外,和不能同时成立。因此,和至少有一个为零。
由可知,只有非零时,为SVR的支持向量,且落在-间隔带之外。落在-间隔带中的样本,满足
5.支持向量机与KNN
**
网友评论