美文网首页
第6章 支持向量机

第6章 支持向量机

作者: Aptitude | 来源:发表于2018-10-08 22:29 被阅读0次

    1. 引言

    分类问题的基本想法是找到一个划分超平面,将不同类别的样本分开。目的在于找到的划分超平面对训练样本的局部“容忍度”最好,使划分超平面所产生的分类结果是最鲁棒的,对未见示例的泛化能力最强。

    2. 间隔与支持向量

    线性方程与间隔

    在这里写一下支持向量机(Support Vector Machine,SVM)的基本型

                                              min 1/2 ||W||^2
                                              s.t. Yi(WtXi+b)≥1   ,    i=1,2,...,m
    

    图片里的内容不再赘述了,说一下几点理解:
    1.y的分类结果只有两个,分别是y=+1和y=-1;
    2.计算间隔时假设离超平面最近的点是之上和之下距离为1的点;
    3.SVM的问题是求解最近点之间的最大间隔;
    4.Yi(WtXi+b)≥1中,Yi为+1或者-1,WtXi+b必须大于1或者小于-1,因为最近的点为+1或者-1。

    3.对偶问题

    提出这个问题的原因在于上节中给出了一组约束条件下求最小值,因此转化为求最值问题。思路是使用拉格朗日乘子法得到“对偶问题”。面对不等式约束,使用KKT(Karush-Kuhn-Tucker)解决。


    Langrange乘子

    对于上图中max值的确定使用SMO。
    求得的偏移项b。


    偏移项b

    4.超平面

    上文是假设训练样本线性可分的,若线性不可分,考虑使用一个超平面将样本分离开来。即将x替换为φ(x),因此这里使用一个核函数将x映射到φ(x)。


    非线性映射

    模型最优解通过“核函数”展开,称为“支持向量展式”。


    支持向量展式
    利用k(.,.)定义的核矩阵。
    再生核希尔伯特空间
    常用核函数

    5.软间隔与正则化

    软间隔(soft margin):允许支持向量机在一些样本上出错。

    优化目标
    其中L0/1称为损失函数。
    三种常见的替代损失函数
    优化目标的一般形式,第一项是用来描述划分超平面的“间隔”大小,另一项是用来表述训练集上的误差。在这里写为更一般的形式,第一项称为“结构风险”,用来描述模型f的某些性质。第二项称为“经验风险”,用来描述模型与训练数据的契合程度,C用于对二者进行折中。这个式子可称为正则化问题,第一项称为正则化项,C称为正则化常数。正则化可理解为一种“罚函数法”,对不希望得到的结果施以惩罚,从而使得优化过程趋于希望目标。
    一般形式

    支持向量机和支持向量机回归我看完了,然而我真的没有看懂,中间涉及的复杂的数学推导完全懵,所以以上内容仅限于依照书能大概整理出算法的思路。现在在数学上的痛都是当时数学课上睡的觉,当时睡得有多沉现在就有多痛!
    明天开始写支持向量机的代码

    相关文章

      网友评论

          本文标题:第6章 支持向量机

          本文链接:https://www.haomeiwen.com/subject/lzdzoftx.html