随着大数据时代的到来,含更多隐含层的深度卷积神经网络(Convolutional neural networks,CNNs)具有更复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和特征表达能力.使用深度学习算法训练的卷积神经网络模型自提出以来在计算机视觉领域的多个大规模识别任务上取得了令人瞩目的成绩.
本文首先简要介绍CNN的发展历史
1.1998年诞生的LeNet奠定了CNN的发展基础,LeNet具备了完善的网络结构(卷积层、池化层、全连接层)被认为是CNN的开端。
2.2012年Geoffrey和他的学生Alex在ImageNet竞赛中,刷新了image classification的记录,一举奠定了deep learning在计算机视觉中的地位,进而Alex竞赛中所使用的的机构被命名为AlexNet, 此结构加入了a: 非线性激活函数ReLu b:抑制过拟合的Dropout以及Data augmentation. 同时可以多个GPU加速计算,加入LRN归一化层。
3.2014年的ILSVRC localization and classification两个问题上,来自Andrew Zisserman 教授的组分别取得了第一名和第二名,由此诞生了VGG-Net,和AlexNet不同的地方是VGG-Net使用了更多的层,通常有16-19层,而AlexNet却只有8层。
4.GoogLeNet: Inception结构成为了(Network In Network)结构的主要创新点,即原来的结点也是一个网络。其使得之后整个网络结构的宽度和深度都可扩大,能够带来2-3倍的性能提升。
5.2015年大规模视觉识别挑战赛分类任务中赢得了第一的ResNet提出来一种减轻网络训练负担的残差学习框架,这种网络要比以前使用过的网络本质上层次更加的深,将其作为输入层相关的学习残差函数。在ImageNet数据集用152层比VGG网络还要深8倍的深度来评估残差网络,却仍然具有较低的复杂度。
卷积神经网络模型在图像分类、物体检测、姿态估计、图像分割和人脸识别等多个计算机视觉应用领域中都有其比较突出的优势
下面我用了一个比较简单的例子来做一简化版的CNN, 公开版数据集cifa10
步骤一:加载数据并处理
a步骤二:建模
b步骤三:训练
model.fit(train_images, train_labels, epochs=5, validation_data=(test_images, test_labels))
网友评论