一、什么是支持向量机
支持向量机(Support Vector Machine,SVM)也称为支持向量网络。是一类按监督学习方式对数据进行二元分类的广义线性分类器。(百度百科)
1.基础概念的了解
①线性可分
在二维空间中,两类点被一条直线完全分开称之为线性可分
非线性可分
用数学语言来描述就是
和分别是N维欧式空间中的两个点集。如果存在N维向量w和实数b,使得所有属于的点都有,而对于所有属于的点则有,则我们称和线性可分。
②Margin间隔
一个线性函数将样本分为两类,将这个函数向左平移直到与一个点相切后停止,向右移动后同理,则我们说这两个平移后的直线间的间隔称之为margin。与这两个边界相切的那些点称之为Support vectors也就是支持向量。
Margin2.数学推导
超平面设每个点的表达式为
它们在空间中满足
是一种数学函数,在数学和计算机运算中,其功能是取某个数的符号(正或负): 当,;当,; 当,
式中的是一个向量,那么它的方向是指向哪边呢?我们在超平面上取两个点和,两点均满足方程那么有
也就是说垂直于超平面,是超平面的法向量
设空间中有任意一点向超平面投影,投影点为
二者之间的距离设为
计算(方法一)
对于有
联立上两式
那么和之间的距离为
计算(方法二)
要计算这两点之间的距离我们首先来看一下在二维空间中点到直线的距离公式为:
扩展到n维空间后,点到直线的距离为
网友评论