美文网首页
svm原理之svm分类超平面

svm原理之svm分类超平面

作者: 何大仁_71c1 | 来源:发表于2019-07-27 18:30 被阅读0次

线性分类器(一定意义上,也可以叫做感知机) 是最简单也很有效的分类器形式.在一个线性分类器中,可以看到SVM形成的思路,并接触很多SVM的核心概念。用一个二维空间里仅有两类样本的分类问题来举个小例子。

如图所示:


和是要区分的两个类别,在二维平面中它们的样本如上图所示。中间的直线就是一个分类函数,它可以将两类样本完全分开。一般的,如果一个线性函数能够将样本完全正确的分开,就称这些数据是线性可分的,否则称为非线性可分的。

什么叫线性函数呢?在一维空间里就是一个点,在二维空间里就是一条直线,三维空间里就是一个平面,可以如此想象下去,如果不关注空间的维数,这种线性函数还有一个统一的名称——超平面(Hyper Plane)!

实际上,一个线性函数是一个实值函数(即函数的值是连续的实数),而分类问题(例如这里的二元分类问题——回答一个样本属于还是不属于一个类别的问题)需要离散的输出值,例如用1表示某个样本属于类别C_1,而用0表示不属于(不属于C_1也就意味着属于C_2),这时候只需要简单的在实值函数的基础上附加一个阈值即可,通过分类函数执行时得到的值大于还是小于这个阈值来确定类别归属。例如有一个线性函数:
g(x) = wx + b
可以取阈值为0,这样当有一个样本x_i需要判别的时候,我们就看g(x_i)的值。若g(x_i)>0,就判别为类别C_1,若g(x_i)<0,则判别为类别C_2(等于的时候就拒绝判断)。此时也等价于给函数g(x)附加一个符号函数sgn(),即
f(x)=sgn [g(x)]
是真正的判别函数。

关于g(x)=wx+b这个表达式要注意三点:

  • 一,式中的x不是二维坐标系中的横轴,而是样本的向量表示,例如一个样本点的坐标是(3,8),则x^T=(3,8),而不是x=3(一般说向量都是说列向量,因此以行向量形式来表示时,就加上转置)。

  • 二,这个形式并不局限于二维的情况,在n维空间中仍然可以使用这个表达式,只是式中的w成为了n维向量(在二维的这个例子中,w是二维向量,注意这里的 w严格的说也应该是转置的形式,为了表示起来方便简洁,以下均不区别列向量和它的转置);

  • 三,g(x)不是中间那条直线的表达式,中间那条直线的表达式是g(x)=0,即wx+b=0,我们也把这个函数叫做分类面。

实际上很容易看出来,中间那条分界线并不是唯一的,我们把它稍微旋转一下,只要不把两类数据分错,仍然可以达到上面说的效果,稍微平移一下,也可以。此时就牵涉到一个问题,对同一个问题存在多个分类函数的时候,哪一个函数更好呢?显然必须要先找一个指标来量化“好”的程度,通常使用的都是叫做“分类间隔”的指标。

下期介绍分类间隔,以及与它相关的数学知识。

相关文章

  • svm原理之svm分类超平面

    如图所示: 什么叫线性函数呢?在一维空间里就是一个点,在二维空间里就是一条直线,三维空间里就是一个平面,可以如此想...

  • SVM

    1. SVM原理 SVM 是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。 ...

  • SVM常考细节

    SVM的原理是什么? SVM是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。...

  • 支持向量机(SVM)常见问题

    1 SVM原理 SVM是一种二分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。(间隔最...

  • 【2018-09-23】支持向量机SVM

    SVM算法的原理是找到一个分割超平面,该平面能把数据集正确的分类,并且间距最大。距离超平面最近的点称为支持向...

  • 支持向量机SVM(Support Vector Machine)

    from sklearn.svm import SVC 原理:SVM的解决问题的思路是找到离超平面的最近点,通过其...

  • 机器学习之SVM

    SVM 概述 SVM(支持向量机),是一种分类算法,用一个超平面将数据分成两份。N维的数据需要(N-1)维的超平面...

  • 统计学习方法之支持向量机

    【概述】 SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧(分类正确性即“分得开”),且样本到超平面...

  • SVM分类器在OpenCV中的使用

    支持向量机(SVM)是通常由超平面定义的区别式分类器。也就是说,给定标记的训练数据(监督式学习),SVM 算法输出...

  • SVM常见面试题

    那你讲一下SVM吧。 SVM是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。...

网友评论

      本文标题:svm原理之svm分类超平面

      本文链接:https://www.haomeiwen.com/subject/clzsrctx.html