Q1:SVM的类型有哪些?
三类:线性可分支持向量机、线性支持向量机、非线性支持向量机
线性可分支持向量机:当训练数据为线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性可分支持向量机,又称“硬间隔支持向量机”。
线性支持向量机:当训练数据近似线性可分时,通过软间隔最大化,得到一个线性分类器,即线性支持向量机,又称软间隔支持向量机。
非线性支持向量机:当训练数据非线性不可分时,通过核技巧及软间隔最大化,学习一个非线性分类器。
Q2:什么是核方法?
当特征空间为希尔伯特空间时,核函数表示将输入从输入空间映射到特征空间得到的特征向量之间的内积。通过使用核函数可以学习非线性支持向量机,等价于隐式的在高维的特征空间中学习线性支持向量机(核技巧)。
Q3:硬间隔(线性可分)支持向量机的学习目标?
在特征空间中找到一个分离超平面,能将实例分到不同的类。分离超平面对应于方程。分离超平将特征空间分成两部分,一部分是正类,一部分是负类。法向量
指向正类。线性可分支持向量机利用硬间隔最大化求得分离超平面,解是唯一的(感知机非唯一)。分类决策函数为:
Q4:函数间隔和几何间隔的定义及解释。
一般来说,一个点距离分离超平面的远近能够刻画分类预测的确信程度。对于分离超平面确定下,
能够相对的表示点x距离平面的远近。而
的符号与类标记符号是否一致能够表示分类是否正确。应此定义函数间隔为:
可对量分类正确性和确信度。
将中的
都扩大或者缩小同样的倍数并不会改变超平面,但衡量样本的预测效果值就不一样了,为了将这个间隔确定,可以通过要求参数规范化,因此几何间隔定义:
则超平面与数据集T的集合间隔为:
ccfr
网友评论