循环神经网络(1)

作者: zidea | 来源:发表于2019-07-30 07:09 被阅读25次

循环神经网络（RNN）简介
深度学习_循环神经网络RNN与LSTM
循环神经网络模型，seq2seq模型理解
深层神经网络简单介绍(1)
「深度学习」循环神经网络 RNN 学习笔记
TensorFlow 实战Google深度学习框架（第2版）第八
使用PyTorch从零开始构建Elman循环神经网络
动手学深度学习(十一) NLP循环神经网络
2020-02-25
2019年上半年收集到的人工智能循环神经网络干货文章

MachineLearninginMarketing

感谢李宏毅的分享
参考《TensorFlow 学习指南》和《TensorFlow 深度学习》
感谢 sentdex 的分享

RNN 主要用于处理序列，特别是对于文本处理，循环神经网（RNN) 是自然语言处理(NLP)中流行的深度学习算法。

之前我们学习卷积神经网（CNN)用于处理空间上结构数据，CNN 在图像识别有着自身优势，而 RNN 在序列结构数据有着自身优势，而且是其他算法无法代替的。随着时间推移的视频或音频，还是基因序列或者是纵向医疗记录。

循环神经网络(RNN) 实例

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, LSTM 
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

mnist = tf.keras.datasets.mnist
(x_train,y_train),(x_test,y_test) = mnist.load_data()

print(x_train.shape)
print(x_train[0].shape)

从输出的结果可以看出数据结构，这里有 60000 张图片，每张图片都是 28 x 28 个像素组成

(60000, 28, 28)
(28, 28)

图片为 28 行每一个每行都有 28 像素，这样一来我们可以将 28 行理解为顺序输入。我们神经网络会逐行按一定次序来读取数据作为神经元输入。

x_train = x_train / 255.0
x_test = x_test / 255.0

搭建神经网络

model = Sequential()

model.add(LSTM(128, input_shape=(x_train.shape[1:]),activation='relu',return_sequences=True))
model.add(Dropout(0.2))

model.add(LSTM(128,activation='relu'))
model.add(Dropout(0.2))

model.add(Dense(32,activation='relu'))
model.add(Dropout(0.2))

model.add(Dense(10,activation='softmax'))

opt = tf.keras.optimizers.Adam(lr=1e-3,decay=1e-5)
model.compile(loss='sparse_categorical_crossentropy',optimizer=opt,metrics=['accuracy'])

model.fit(x_train,y_train,epochs=3, validation_data=(x_test,y_test))

Epoch 1/3
60000/60000 [==============================] - 166s 3ms/sample - loss: 0.7293 - acc: 0.7573 - val_loss: 0.1420 - val_acc: 0.9559
Epoch 2/3
60000/60000 [==============================] - 162s 3ms/sample - loss: 0.1766 - acc: 0.9524 - val_loss: 0.0902 - val_acc: 0.9732
Epoch 3/3
60000/60000 [==============================] - 164s 3ms/sample - loss: 0.1166 - acc: 0.9687 - val_loss: 0.0844 - val_acc: 0.9752

上面代码演示了如何使用循环神经网来训练我们识别手写数字数据集来完成识别图的模型，这里大家不必担心如何设计出图形以及每一层的作用，随后分享。现在 keras 给我们提供好用 api 帮助可以不加思索快速搭建出循环神经网络。不过还是很有必要了解其背后的原理。下面通过李宏毅老师讲解给大家分享循环神经网络的架构