线性分类器有助于我们建立起整个神经网络和整个卷积网络。
![](https://img.haomeiwen.com/i11402959/6bc40175147449d1.png)
![](https://img.haomeiwen.com/i11402959/6c34fa7496d26362.png)
![](https://img.haomeiwen.com/i11402959/fe9360c3a77e5b86.png)
![](https://img.haomeiwen.com/i11402959/9c935b8c611710a8.png)
这里有一个2*2,有4个像素的图像,线性分类器的工作方式是,我们把这个2*2的图像拉伸成一个有四个元素的列向量,这里我们只限制有3类,因而权重矩阵为3*4,有四个像素和3个类,现有一个三元素 偏差向量,它给我们提供了每个类别的数据独立的偏差项。
![](https://img.haomeiwen.com/i11402959/533791ff3c27a37a.png)
可以看到猫的分数将会是我们图像的像素和这个权重矩阵之间的输入乘积加上这个偏置项,如此可以理解线性分类几乎是一种模板匹配方法,这个矩阵的每一行对应图像的某个模板。
但是,这也存在一个问题,每个类别只能学习一个模板,如果这个类别出现了某种类型的变体,那么它将尝试求取所有不同变体的平均值,并且只使用一个单独的模板来识别其中的每一个类别。
线性分类器只允许学习每个类别的一个模板,当我们来看神经网络和更复杂的模型,我们能够得到更好的准确率,因为这些模型再也没有每个类别学习一个单独的模板的限制。
线性分类器的另一个观点是作为点和高维空间的概念,你可以想象成我们每一张图像都是类似高维空间中一个点的东西,现在这个线性分类器在这些线性决策边界上尝试画一个线性分类面 来划分一个类别和剩余其他类别。
![](https://img.haomeiwen.com/i11402959/7068adb03c4e1d05.png)
![](https://img.haomeiwen.com/i11402959/b325ced7b2dbe92b.png)
总结
线性分类可以理解为每个种类的学习模板,对图片里的每个像素以及n个类别里的每一项,矩阵W里都有一些对应的项告诉我们那个像素对那个分类有多少影响,也就是W的每一行都对应一个分类模板,如果解开每一行的值,那么每一行又分别对应一些权重,每个图片像素值和对应那个类别的一些权重将这行分解回图像的大小,我们就可以可视化学到每个类的模板。
也可从高维空间的角度考虑线性分类器。
网友评论