感知机模型原理(二)

作者: 徐_清风 | 来源:发表于2019-02-17 19:22 被阅读0次

3. 感知机算法的原始形式

在之前我们提到过感知机模型的损失函数为L(w,b)=-\sum_{x_i\in M}y_i(wx_i+b), 感知机的算法本质上就是求解损失函数最优的过程, 可以采用梯度下降法和拟牛顿法进行求解, 其中最常用的是梯度下降法.

首先, 任选一个超平面, 然后通过梯度下降法不断地极小化损失函数.需要注意的是,在极小化过程中不是一次性选择所有误分类点进行梯度下降,而是随机地选取一个误分类点进行梯度下降,也就是说,这里采用的是梯度下降法中的随机梯度下降.

根据梯度的定义,我们可以得到损失函数的梯度:
\begin{cases} ▽_wL(w,b)=-\sum_{x_i\in M}y_ix_i \\ ▽_bL(w,b)=-\sum_{x_i\in M}y_i \end{cases}
假设随机选择一个误分类点(x_i,y_i), 对w,b进行更新:
\begin{cases}w←w+\eta y_ix_i \\ b←b+\eta y_i\end{cases}
其中,\eta为学习效率,有时也称为步长.通过反复的迭代使得损失函数的数值不断的减小,直到0为止.

上述的算法是感知机模型的基本算法,也称为原始形式,其具体的过程可以解释为:当一个实例点被误分类(即位于分类错误的一侧)时,调整w,b的值,使得分类超平面向该误分类点的一侧移动,目的是减少该误分类点到超平面间的距离,直至超平面越过该误分类点使其能够被正确分类.

不同的初始值以及选取不同的误分类点,可能会导致不同的感知机模型.也就是说感知机模型的结果不唯一.

4.感知机算法的收敛性

当训练数据集线性可分时,那么感知机算法的原始形式迭代是收敛的.也就是说,经过有限次迭代可以得到一个将训练数据集完全正确划分的超平面及感知机模型.反之,当训练数据集线性不可分时,感知机学习算法不收敛.

5.感知机算法的对偶形式

对偶形式的基本思想是:将w和b表示维实例x_i和分类标记y_i的线性组合的形式,然后通过求解其系数而求得w和b.

假设第i个实例点(x_i,y_i)由于误分类而进行更新的次数为n_i, 从学习过程中不难得到w,b的表示:
\begin{cases} w=\sum_{i=1}^N n_i\eta y_ix_i \\ b=\sum_{i=1}^N n_i\eta y_i \end{cases}
将上式中的w,b分别代入感知机模型后,可以发现结果与w,b无关, 而与n_i有关.另外, 实例点更新的次数越多(即n_i值越大),意味着它距离超平面越近,也就经常被误分类.

通过以上,也可以看出对偶形式是基于原始形式推导得到的,而且对偶形式中的训练实例仅以内积的形式出现,通常会预先将训练集中实例间的内积计算出来并以矩阵(即Gram矩阵)的形式存储,这样可以优化计算速度.

参考:
李航博士著《统计学习方法》

相关文章

  • 感知机模型原理(二)

    3. 感知机算法的原始形式 在之前我们提到过感知机模型的损失函数为, 感知机的算法本质上就是求解损失函数最优的过程...

  • 感知机

    感知机 感知机模型 感知机学习策略 感知机学习算法 算法的收敛性 感知机学习算法的对偶形式 感知机实现二分类模型 ...

  • 感知机模型原理(一)

    1. 感知机模型 感知机是二分类模型,旨在找到一个可以将输入空间划分为正负两类的超平面。假设输入空间是, 输出空间...

  • 统计学习方法(李航)--第二章 感知机(比较基础)

    感知机是二分类的线性分类模型,属于判别模型,包括原始形式和对偶形式。 (一)感知机模型 公式为: f...

  • 从感知机到SVM的学习

    感知机是SVM的基础嘛,两者都有线性二分类模型,感知机原理比较简单,就是自变量是wx+b的符号函数,优化函数就是所...

  • 感知机(perception)与其算法实现(R)

    1.感知机模型 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取值为1和-1二值。感知...

  • 神经网络和深度学习笔记——01 神经元

    神经元模型 感知机(perceptron) 多个二进制输入经过感知机得到一个二进制输出; 感知机对每个输入赋予权重...

  • 统计学习方法之感知机Perceptron

    1. 感知机模型详解 感知机由1957年提出,感知机模型较为简单,是NN和SVM的基础模型。结构如下图 定义:给定...

  • 超简单感知机及代码实现

    感知机(preceptron) 感知机是二分类的线性分类模型,输入为特征空间,输出为实例的类别,值域为,感知机将对...

  • Perceptron & KNN(面试准备)

    1、简述感知机模型并证明其收敛性 感知机是二分类的线性分类模型,感知机对应于特征空间中将实例划分为正负两类的分离超...

网友评论

    本文标题:感知机模型原理(二)

    本文链接:https://www.haomeiwen.com/subject/axogeqtx.html