美文网首页
支持向量机(SVM)

支持向量机(SVM)

作者: 蛐蛐囍 | 来源:发表于2018-12-01 17:21 被阅读0次

给定一个特征空间上的训练数据集T=\{(\vec{x}_1,y_1),(\vec{x}_2,y_2),...,(\vec{x}_N,y_N)\} ,其中,\vec{x}_i = (x_i^{(1)},x_i^{(2)},...,x_i^{(n)}) \in X = R^n,y_i \in Y = {+1,-1},i = 1,2,...,N

  • y_i = +1,则称\vec{x}_i为正例;
  • y_i = -1,则称\vec{x}_i为负例。
    假设训练集数据集线性可分,希望在特征空间中找到一个分离超平面,它能将所有的正例划分到超平面的一侧、所有的负例划分到超平面的另一侧。由于超平面可以用方程\vec{w}\times \vec{x} + b = 0)表示,它由法向量\vec{w}和截距项b来表示。

当训练集线性可分时,理论上存在无穷多个超平面可以将训练集划分开来。线性可分向量机提出了选择间隔最大化的约束,最终求得的超平面唯一。

假定学习到的超平面为:\vec{w}^*\times \vec{x} + b^* = 0
定义分类决策函数为:f(\vec{x}) = sign(\vec{w}^*\times \vec{x} + b^*)
该分类决策函数被称为线性可分支持向量机。

通常可以将一个样本离超平面的距离来表示分类预测的可靠性:一个样本离超平面越远,则分类越靠谱。

给定超平面\vec{w}\times\vec{x} + b = 0,样本\vec{x}_i到超平面的距离为:|\vec{w}\times\vec{x}_i+b|\vec{w}\times\vec{x}_i+b的符号与y_i的符号是否一致表示分类是否正确

所以用y\times(\vec{w}\times\vec{x} + b)来表示分类的正确性以及却星都(符号决定了正确性,范数决定了可信度)。

给定训练数据集T,给定超平面(\vec{w},b),定义超平面关于样本点(\vec{x}_i,y_i)几何距离为:
\hat{\gamma}_i = y_i(\frac{\vec{w}}{||\vec{w}||}\times\vec{x}+\frac{b}{||\vec{w}||})
定义超平面关于训练集T的几何距离为超平面关于T所有样本点(\vec{x}_i,y_i)的几何距离的最小值:\hat{\gamma} = min_{\vec{x}_i\in T}\hat{\gamma}_i

支持向量机的目标是:求解能够正确划分训练数据集,且几何距离最大的分离超平面。
即:
max_{\vec{w},b}\gamma
s.t.
y_i\times(\vec{w}\times\vec{x_i} + b)≥1,i = 1,2,...,N
等价于
min_{\vec{w},b}1/2||\vec{w}||_2^2
s.t.
y_i\times(\vec{w}\times\vec{x_i} + b)≥1,i = 1,2,...,N

相关文章

网友评论

      本文标题:支持向量机(SVM)

      本文链接:https://www.haomeiwen.com/subject/ecfrcqtx.html