本文来自我的个人博客 https://www.zhangshenghai.com/posts/48428/
感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别。感知机是神经网络与支持向量机的基础。
感知机模型
假设输入空间,输出空间。输入表示实例的特征向量,对应于输入空间的点;输出表示实例的类别。由输入空间到输出空间的函数:
称为感知机。其中,和为感知机模型参数,叫做权值或权值向量,叫偏置,表示和的内积。是符号函数,即
感知机是一种线性分类模型,属于判别模型。感知机模型的假设空间是定义在特征空间中的所有线性分类模型或线性分类器,即函数集合。
感知机有如下的几何解释:线性方程
对应于特征空间中的一个超平面,其中是超平面的法向量,是超平面的截距。超平面将特征空间划分为两部分,位于其中的点被分为正、负两类,超平面称为分离超平面。
感知机的学习策略
输入空间中的任一点到超平面的距离:
对于误分类数据,当时,,当时,,即与异号,有
误分类点到分离超平面的距离为
假设超平面的误分类点集合为,则所有误分类点到超平面的总距离为
给定训练数据集
其中,。感知机的损失函数定义为
其中,为误分类点的集合。显然,损失函数是非负的。如果没有误分类点,损失函数值是0。而且,误分类点越少,误分类点离超平面越近,损失函数值就越小。感知机学习的策略是在假设空间中选取使上述损失函数式最小的模型参数,即感知机模型。
感知机学习算法
感知机算法(原始形式)
输入:训练数据集,其中;学习率。
输出:;感知机模型
- 选取初值
- 在训练集中选取数据
- 如果
- 转至2,直至训练集中没有误分类点
感知机算法(对偶形式)
设修改n次,则关于的增量分别是和,其中。可表示为
其中,
输入:训练数据集,其中;学习率。
输出:;感知机模型 ,其中
- 在训练集中选取数据
- 如果
- 转至2,直至训练集中没有误分类点
注:对偶形式中训练实例仅以内积形式出现,可预先计算矩阵存储实例间内积
网友评论