卷积神经网络基础讲解

作者: _木豆_ | 来源:发表于2017-05-23 13:15 被阅读459次

基于Tensorflow实现CNN对MNIST分类
datawhale-task05（卷积神经网络基础；leNet；
CNN
卷积神经网络基础讲解
第五天-卷积神经网络基础,LeNet,卷积神经网络进阶
卷积神经网络基础 2020-02-18
神经网络（一）
神经网络（二）
去噪自编码深度卷积网络实战——地震去噪实战案例讲解
CS231n 卷积神经网络: 架构, 卷积/池化层(上)

转载请注明出处

1什么是卷积神经网络(CNN)

1.1 什么是卷积操作

CNN中的卷积和数字信号处理中的卷积其实不是一回事，但有点类似。这里说的只是CNN中的卷积操作。

对图像（或者可以表示为同样结构的其他数据，如文本、语音等）和滤波矩阵（一组固定的权重：因为每个神经元的多个权重固定，所以又可以看做一个恒定的滤波器filter）做内积（逐个元素相乘再求和）的操作就是所谓的『卷积』操作，也是卷积神经网络的名字来源。

（gif动图见附件）

备注：

http://deeplearning.stanford.edu/wiki/index.php/Feature_extraction_using_convolution

一个很自然的想法，是filter的各个权重应该是多少？filter的size怎么取？

1.2 卷积神经网络的概念

CNN的概念最早来自于对“感受野”的研究。科学家对猫的视觉细胞研究发现，每一个视觉神经元只处理一小块区域的视觉图像。即感受野（receptive field）。

卷积神经网络(Convolutional Neural Networks)是一种在空间上共享参数的神经网络。通过共享参数，减少了参数的个数。卷积的图示

备注：上图是以“图片”举例，所以depth是RGB三个维度。后面我们会说到CNN也可以处理文本。用卷积来处理文本分类的要点在于怎么把文本数据准备成CNN所需要的这种固定width和height的形式。

卷积神经网络简单讲就是把一个图片的数据传递给CNN，原涂层是由RGB组成，然后CNN把它的厚度加厚，长宽变小，每做一层都这样被拉长，最后形成一个分类器：

CNN是首个成功进行多层训练的网络结构（Lecun的LeNet5），之所以CNN能够成为“第一个吃螃蟹”的网络，除了因为LeCun作为深度学习三巨头之一，“天生神力”，有一个不可忽视的因素或许是，CNN利用空间结构大大减少了参数量，提高了训练效率，避免了全连接网络(FCN, full connection Network)的参数过多不好训练、以及梯度弥散(gradient vanishment)的问题。

2CNN中的一些基本概念

卷积核

卷积核，英文名kernels,有时候也叫滤波器(filters )。卷积核是CNN的核心。从信号处理的角度而言，滤波器是对信号做频率筛选，这里主要是空间-频率的转换，cnn的训练就是找到最好的滤波器使得滤波后的信号更容易分类，还可以从模版匹配的角度看卷积，每个卷积核都可以看成一个特征模版，训练就是为了找到最适合分类的特征模版。

问题：卷积核的大小和初始值怎么取？

feature map

每一个卷积核滤波得到的图像就是一类特征的映射，也就是一个feature map