SVM
分类问题就是经过样本数据的分类训练后,能将新的数据归结到特定的类别中。分类问题的基础是二分类,即只有两个类别。
最简单的二分类就是平面中画出一条直线,一边是类别A,一边是类别B。

直线我们可以用y=ax+b来描述,红色的是ax+b-y>0,蓝色则是ax+b-y<0
这是线性可分。拓展到n维空间,线性可分就是对于两个点集A和B中的点a和b,我们可以找到n维向量w和实数r,使得wa+r>0,wb+r<0。
样本能够用上述方法分开的模型叫线性分类模型。其中将两个点集分开的wx+r=0被称为超平面。最好的超平面是样本被分开,并且样本点到超平面的距离最大。
线性可支持向量机是一种分类模型,目的就是找到最大间隔的超平面。
线性可分SVM的目标函数是一个有约束条件的极值问题。采用的方法是拉格朗日乘子法。
网友评论