如果一个数据集是线性可分的,那么存在无穷多个超平面将各个类别分开。
支持向量机算法
一、解决线性可分问题
二、再将线性可分问题中获得的结论推广到线性不可分情况。
-
分开的超平面哪个最好?先从二维入手,三条线哪条最好?
image.png
image.png
虚线圆代表两个样本的实际位置,由于误差原因呈现的位置是红色圆和红色叉,而1号和3号线都由于误差而出现判断错误,因而2号线更能抵御误差所带来的干扰。
-
将寻找二号线变成一个最优化问题,如何画出2号线?
image.png
间隔最大的是2号线
image.png
image.pngso
间隔最大并不能唯一确定一条直线。平行于2号线的其他线所产生的间隔和2号线的间隔一样,都是最大。因此规定这条线必须在两条平行线正中间,到两边距离相等。
网友评论