说说卷积神经网络（2）：AlexNet

作者: 晚晴风_ | 来源:发表于2018-04-09 21:00 被阅读34次

说说卷积神经网络（2）：AlexNet
CNN之——AlexNet
[动手学深度学习-PyTorch版]-5.6卷积神经网络-深度卷
无知的一些入门的东西
深度卷积网络：实例探究
TORCH03-05AlexNet网络与ImageNet
卷积神经网络 AlexNet
AlexNet -- 卷积神经网络
从overFeat到FasterRCNN
经典神经网络

上文说了CNN的基本结构，今天说说AlexNet，这也是一种典型的CNN网络，虽然有一点年份了。AlexNet是Alex在2012年提出的一种网络结构，并且获得了 IMAGENET Challenge 2012图像识别大赛的冠军。这是最有名的计算机视觉挑战赛，使得CNN成为图像分类上的核心算法模型。而2012年是深度神经网络第一次在该比赛中被使用。

该网络的运行结果比之前的传统解决方法好很多。详细的介绍在这篇论文里.

AlexNet网络结构

包括11层卷积神经网络，结构如下：

fig-8.png

这里可以看到输入和输出之间有11层，每一层的输出是下一层的输入。

第0层：输入图像
- 尺寸：227x227x3
- 注意：在上文的论文中图像的尺寸是224x224x3这可能是个印刷错误
第1层：使用96个大小为11x11，步长为4的filter进行卷积
- 尺寸：55x55x96
- 计算过程：(227-11)/4 + 1 = 55
- 深度为96是因为1维对应着一个filter，一共有96个filter
第2层：使用尺寸为3x3步长为2的filter进行最大池化
- 尺寸：27x27x96
- 计算过程：(55-3)/2 +1 =27
- 深度跟上一层相同，例如96，是因为每一层的池化操作都是独立进行的。
第3层：使用256个尺寸为5x5步长为1，边缘填充(padding)为2的filter进行卷积
- 尺寸：27x27x256
- 因为padding是(5-1)/2 =2，所以图像的尺寸没有发生变化。
- 深度为256是因为有256个filter。
第4层：使用尺寸为3x3步长为2的filter进行最大池化
- 尺寸：13x13x256
- 计算过程：(27-3)/2 +1 =13
- 深度跟上一层相同，例如256，是因为每一层的池化操作都是独立进行的。
第5层：使用384个尺寸为3x3步长为1，边缘填充(padding)为1的filter进行卷积
- 尺寸：13x13x384
- 因为padding是(3-1)/2 =1，所以图像的尺寸没有发生变化。
- 深度为384是因为有384个filter。
第6层：使用384个尺寸为3x3步长为1，边缘填充(padding)为1的filter进行卷积
- 尺寸：13x13x384
- 因为padding是(3-1)/2 =1，所以图像的尺寸没有发生变化。
- 深度为384是因为有384个filter。
第7层：使用256个尺寸为3x3步长为1，边缘填充(padding)为1的filter进行卷积
- 尺寸：13x13x256
- 因为padding是(3-1)/2 =1，所以图像的尺寸没有发生变化。
- 深度为256是因为有256个filter。
第8层：使用尺寸为3x3步长为2的filter进行最大池化
- 尺寸：6x6x256
- 计算过程：(13-3)/2 +1 =6
- 深度跟上一层相同，例如256，是因为每一层的池化操作都是独立进行的。
第9层：有4096个神经元的全连接层
- 在这一层，输入6x6x256 = 9216个像素，
- 用4096个尺寸为6x6x256的filter对这些数据进行卷积运算
- 输出4096个神经元
- 权重取决于反向传播。
第10层：有4096个神经元的全连接层
- 跟上一次层相似
- 输出的4096个数据与本层的4096个神经元进行全连接
第11层：有1000个神经元的全连接层
- 这是最后的一层，上一层输出的4096个数据与本层的1000个神经元进行全连接
- 输出1000个神经元，因为IMAGENET有1000个待预测类别