第一个卷积神经网络

作者: noodu | 来源:发表于2019-03-10 13:38 被阅读0次

CS231n 卷积神经网络: 架构, 卷积/池化层(上)
视觉
datawhale-task05（卷积神经网络基础；leNet；
卷积神经网络
再战机器学习—卷积神经网络
卷积神经网络
二维卷积运算
CNN
CNN基本算子与操作
卷积层（Convolution Layer）

在前文中我们用全连接网络实现了手写数字的识别。对于图像相关的任务，卷积神经网络CNN能够更好的提取特征，并能减少网络参数，　接下来会对该程序做一些小改动

from __future__ import absolute_import, division, print_function
import tensorflow as tf
from tensorflow.keras.layers import Dense, Flatten, Conv2D
from tensorflow.keras import datasets, layers, models

(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

# Normalize pixel values to be between 0 and 1
train_images, test_images = train_images / 255.0, test_images / 255.0

model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

主要的改动在model处，加入了２个（卷积层layers.Conv2D +　池化层layers.MaxPooling2D）
卷积层有３２个卷积核，　每个尺寸为３x3　,激活函数是relu，　第一层的输入是２８＊２８的黑白图像，所以通道为１（２８，２８，１）。如果是彩色图像，　通道为３
池化层的参数为（２，２），从２Ｘ２个数值中取出最大的一个，　这样在长，宽两个维度的大小减半。最后依然是通过softmax完成分类。

可能是作者的系统配置问题，运行时出错，ｃｕＤｎｎ无法初始化。所以做了些修改

from __future__ import absolute_import, division, print_function

import tensorflow as tf

from tensorflow.keras.layers import Dense, Flatten, Conv2D
from tensorflow.keras import datasets, layers, models

from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession

config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)

(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

# Normalize pixel values to be between 0 and 1
train_images, test_images = train_images / 255.0, test_images / 255.0

model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)