Support Vetor Machine Summary

作者: 多了去的YangXuLei | 来源:发表于2017-05-20 20:00 被阅读48次

Support Vetor Machine Summary
Support Vector Machine
SVM
SVM
大学渣的ISLR笔记(9)-Support Vector Mac
cs231n：assignment1——Q2: Training
3 SVM CLASSIFIER R包（caret）
支持向量机&&聚类
Support Vector Machine
Support Vector Machine

经过最近的学习了解了部分理论但是没有实践应用，所以先写下来，可能不准确。

定义：

在reddit上看到一个很好的解释更直观和生动：
如何向一个五岁的孩子解释SVM
知乎上也有人提到这个，而且已经整理如下：中文

wiki定义:其实就是个监督学习模型，用来分析回归和分类，它巧妙的运用非线性变换把低维的特征投影到高维，可以执行比较复杂的分类任务（升维打击），是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；

包含了构建从简单到复杂的模型：线性可分支持向量机（linear support vector machine in linearly separable case)、线性支持向量机（linear support vector machine)及非线性支持向量机（non-linear support vector machine)。简单模型是复杂模型的基础，也是复杂模型的特殊情况。（具体可以看李航老师的《统计学习方法》）

1基本问题

在知错能改感知机中，学习到在线性可分的训练数据中，我们可以得到不能分分类界线

为了得到最大边界间隔的超平面，将问题准换为优化问题，期中margin(b,w)表示超平面wx+b 离样本的最小距离，进而让这个最小距离最大化：

描述距离：

描述距离
距离推导的结果：

将问题转化为：

进一步简化，因为w和b同时成倍的放缩不会影响超平面的变化，所以总可以找到一组w* 和b使得miny(wx+b *)=1,所以有

当然可以用反正法证明一下，假设

y(*wx+b *)>1，我们可以通过放缩w，b得到更优化的解，约束条件和下图等价

最后得到上图的优化问题，这个问题的形式和二次规划（线性规划的进阶版）一致，所以可以用二次规划的方法解决。

2可行性

因为svm对噪声的容忍性更强，所以从VC bound 角度讲(超平面到底能产生多少圈圈叉叉分类的组合)，对于PLA来说可以shatter所有组合，但svm会对margin有限制

linear hard SVM不能shatter任意三个inputs，说明有更少的维度，所以有更好的泛化能力。同时，使用特征转化，可以使Linear hard SVM 进行更精细分类。

使用场景

SVM的典型使用场景如：
一、房价估算
根据过去十年来房价和房屋面积、卧室数量、当地消费水平等等各种因素数据，将房屋分为「豪宅」、「中等」、「经济型住房」、「贫民窟」等几类；
使用SVM训练这些数据得出一个模型，可以用来预测在新的条件下，某个住房可以被划归到哪种分类，价值区间多少。

二、垃圾邮件分类器：
获取可疑的spam email关键词列表，例如：Buy、now等（实际Spam Corpus可以参考使用Apache Spam Assassin）；
收集大量的spam和非spam邮件数据，将其中包含的可疑spam关键词找出并标记在特征向量中，用SVM训练这些数据，得出一个模型，用来判断一封新的邮件是否为一个垃圾邮件。