网络学习系列（三）Inception系列

作者: 叶天羽 | 来源:发表于2018-11-06 19:21 被阅读0次

网络学习系列（三）Inception系列
Inception家族
BN（Batch Normalization）在TensorFl
深度学习基础(1)—卷积神经网络Inception系列
经典分类CNN模型系列其六：Inception v4与Incep
『Inception-v4, Inception-ResNet
经典卷积网络之InceptionV3
『Batch Normalization: Accelerati
Redux入门学习系列教程（二）
Redux入门学习系列教程（四）

Inception v1

论文链接：Going deeper with convolutions

要解决的问题：

对于深度学习来说，目前的共识是更深的网络的性能要优于较浅的网络，所以论文中所做的就是在充分利用计算机资源的基础上，精心设计网络的结构，使网络更深。

网络的实现：

1、原始结构：

网络实现的关键是找到某些密集成分，来拟合网络的局部稀疏结构，为了做到这点，网络去除了全连接层，同时构造了上述的结构，体现了聚类的思维，这样做增加了网络的宽度，同时增加了网络对多尺度的适应性。这个地方卷积核的尺寸不具有特殊的含义，仅仅是为了方便最终组合特征图。然而，这样的结构也有一个较大的缺点，那就是5*5卷积的存在，会极大的增加运算量，同时又有池化层的存在，进行特征图的融合增加输出的数量，使得网络在计算上并不高效。

2、改进结构：

为了减小运算量，在进行卷积之前加入了1*1的卷积进行降维，使得这种结构的高效成为可能。

3、整个结构：

网络的前端还是普通的卷积网络结构，在后面使用了inception网络的堆砌，同时，在网络的下面，还延伸出了几个分支，这是用来进行辅助分类。

Inception v2

论文链接：Batch Normalization

要解决的问题：

当对深层的网络进行训练时，由于模型的参数不断的改变，每一层输入的概率分布都在不断的变化，这就要求使用非常小的学习率，同时需要非常谨慎的设置参数。而且由于非线性饱和的存在，会使得网络非常难以训练，这个现象被称之为internal covariate shif。

解决方法：

1、由经验可知，对输入进行白化处理，可以加快收敛，因此，为了解决每层的输入不一致的问题，考虑对每一层的输入进行归一化，使其分布一致。

2、理论上来说，应该在每一层的非线性激活之后进行归一化操作，然而，在训练初期分界面还在剧烈变化，计算出的参数很不稳定，所以一般讲归一化的操作放在非线性激活之前，这也是现在网络所采用的方式。

3、论文中提出的批量归一化，并非只是简单的白化处理，在计算梯度时就需要考虑归一化的问题。因为网络学习的本质就是学习数据的分布，如果只是简单的归一化会破坏这种分布，论文给出的解决办法是归一化之后要通过均值和方差两个系数还原这种分布。（在别处还看到另一种说法，就是如果只是单纯的归一化，一旦进行反向传播操作，会撤销这种归一化的处理，所以在最后要通过均值和方差两个系数来避免这种情况的出现）

4、通过论文中这种归一化的操作，不仅可以加快训练，而且在一定程度上可以解决过拟合问题。

Inception v3

论文链接：Rethinking the Inception Architecture for Computer Vision

要解决的问题：

相较于AlexNet与VGGNet，googleNet的计算量与参数无疑少了许多，但是，由于网络的复杂性，使得网络不易于向更大规模进行扩展，论文主要是为了解决这个问题。

网络的实现：

1、

使用3*3卷积代替5*5卷积，且使用了非线性激活。

2、尝试进一步减小网络的计算量，结果发现，非对称的结构要比进一步减小卷积核的尺寸更加高效，即将n*n的卷积分解为1*n与n*1，网络设计如下：

实践证明，在网络的开始应用这种结构效果并没有明显的改善，这种网络适用于中等的网络（特征图的大小为m*m，m介于12到20之间）

在高维特征上，如下的网络结构更好一些：

3、采用了辅助分类结构，实践证明，在初期辅助分类结构并没有加速训练过程，反而在训练将要结束时开始发挥作用，辅助分类结构在这里起到了一个正则化的作用，实验证明，辅助分类结构使用了batch-normalized或dropout时，主分类器效果会更好。

4、一般来说，会使用池化来减小特征图的尺寸，但为了避免表示瓶颈，在池化之前会增加特征图的维数，这会导致计算量的增加，论文提出了一种并行结构，使用步长为2的卷积与池化并行操作，之后将两者的响应结合在一起，这样既能降低维度，又不至于造成信息提取上的损失。

Inception v4

论文链接：Inception-v4, Inception-ResNet

要解决的问题：

ResNet网络取得了较好的效果，所以尝试结合ResNet

网络细节：

1、incetion v4:

其中，Stem的结构如图所示：

inception-A、B、C的结构如下所示：

为了减小运算量，网络加入了reduction结构，如下所示：

整个网络思想与前几个版本并没有太大的不同，这里不再赘述。

2、inception-resnet v1与inception-resnet v2：

两者的框架与inception v4大致相同，其中的改进就是将inception模块变成了inception-resnet模块，如下所示：

另外，引入了残差连接之后，如果一个残差连接的滤波器过多，很可能出现输出都是0的结果，论文中给出的解决方案是在残差函数之后，激活函数之前引入一个尺度变换，如下所示：

网络学习系列（三）Inception系列
Inception v1 论文链接：Going deeper with convolutions 要解决的问题： ...
Inception家族
Inception网络就是GooleNet的一系列家族网络 Inception V1Goole net做的就是将几...
BN（Batch Normalization）在TensorFl
BN是Google inception系列模型里，从inception v2到inception v3的一个重要升...
深度学习基础(1)—卷积神经网络Inception系列
问题导读： 1.卷积神经网络的基本单元? 2.典型卷积神经网络有哪些？ 3.卷积神经网络Inception系列的启...
经典分类CNN模型系列其六：Inception v4与Incep
介绍 Inception系列模型设计的核心思想讲至Inception v3基本已经尽了。但2015年Resnet的...
『Inception-v4, Inception-ResNet
一为什么读这篇 Inception系列的官方最后一篇，读完这篇，才能说对整个Inception体系有个初步的了解...
经典卷积网络之InceptionV3
InceptionV3模型一、模型框架 InceptionV3模型是谷歌Inception系列里面的第三代模型，...
『Batch Normalization: Accelerati
一为什么读这篇 Inception系列的第二篇，Inception-v2，这篇论文引入了后来被广泛使用的Batc...
Redux入门学习系列教程（二）
Redux入门学习系列教程(一)Redux入门学习系列教程(二)Redux入门学习系列教程(三)Redux入门学习...
Redux入门学习系列教程（四）
Redux入门学习系列教程(一)Redux入门学习系列教程(二)Redux入门学习系列教程(三)Redux入门学习...