在简单了解了LSTM原理之后,本期我将以航班延误预测为例为大家介绍一下如何利用Python编程来构建LSTM模型。
这里我们要用到一个高级的深度学习链接库——Keras,它以TensorFlow或者Theano作为后端引擎,只处理模型的建立、训练和预测等功能,至于底层操作细节,Keras会帮你转化成Theano或TensorFlow相对指令。
Windows下用Anaconda安装Tensorflow和Keras
关于Tensorflow和Keras的安装,大家可以参考以下的博客。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议
本文链接:https://blog.csdn.net/lzy_shmily/article/details/80803433
需要注意的两点是:
-
一定要先安装Tensorflow再安装Keras
-
一定要在刚刚创建的tensorflow的环境下安装cpu版本的TensorFlow
利用Keras建立深度学习模型
利用Keras建立深度学习模型,就像在蛋糕架上面一层一层地插蛋糕。在这里,我们选择的“蛋糕架”是Sequential模型,它是多个神经网络层的线性堆叠。那么对于Sequential更多的信息,请参考Keras的中文官方文档(https://keras.io/zh/models/sequential/)。
构建LSTM模型来预测航班延误
接下来我们以航班延误预测为例来说明如何构建LSTM模型。
在航空领域,一架飞机每天要完成多个航班的飞行任务,这就形成了一个航班序列,如果飞机在一个航班任务中发生了延误,那该延误可能会沿着航班序列进行传播。
注:图片来源于网络。
当然,飞机也可能通过中途加速或者沿着直线飞行从而将延误抵消。那么我们在这里利用Python构建LSTM模型来预测一架飞机在下一个时刻的到港延误。
数据来源:美国交通部运输统计局提供的公开的航班数据
代码来源:https://www.evolutionarylearn.com/paper/python-keras-tensorflow-mts/
1 数据预处理
-
剔除掉航班取消和改航记录
-
将数据整理成时间序列数据,也就是将计划到港时间(年-月-日-时-分)作为数据表的索引
2 导入模块
3 建立****LSTM****类
LSTM类的基本框架是初始化,数据集分割,网络创建与训练,网络评估和结果可视化。
【初始化】
初始化主要是将基本的参数和数据导入进将要创建的实例。代码如下:
【数据集分割】
数据集分割包括两部分,一部分是特征选择,一部分是分割测试集和训练集。
这段代码中的测试集划分用的是test_data = self.dataset[train_size - self.look_back - 1:len(self.dataset), selected_list],为什么不是test_data = self.dataset[train_size :len(self.dataset), selected_list]呢?这个是为了保证测试集中有更多样本,后面一种会由于存在窗口损失掉一部分数据,减一应该是为了作图时连接训练部分和测试部分。
【网络创建】
开始在蛋糕架上插蛋糕~
【网络评估】
这里我们的评估指标选用的是R^2
【可视化】
4 导入参数
num_neur=[15, 10]表示这个LSTM网络有两个隐藏层,第一层的神经元个数为15,第二层的神经元个数为10;select_feature = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]表示我选择了数据集中所有的特征,不选择的设为0就好。所选特征包括:到港延误、季度、周几、出发机场、到达机场、计划和实际运行时间、距离、在空时间、计划过站时间、到达机场每小时的计划离港流量和计划到港流量。
5 程序运行结果
【网络结构】
【拟合网络、训练和测试结果】
我们创建和拟合LSTM网络所需的时间为225.81秒,训练集的[图片上传失败...(image-bf1aa3-1574838007274)] 值为0.55,测试集的[图片上传失败...(image-245725-1574838007274)] 值为0.44,可以看出,模型的预测结果并不是很好,因为这里我们并没有对超参数进行选择,而且航班延误的一个很重要的影响因素——天气的相关数据我们并没有加进去。
本期结语
到这里,LSTM网络的理论及其在交通建模中的应用的相关介绍就全部结束了。
如果你有问题和不同的看法,可以在评论区留言,我们互相交流,互相学习,共同进步~
什么,你们觉得没看够啊???
那就关注我们的公众号吧!
【交通科研Lab】
致力于
“分享学习点滴,期待科研交流!”
网友评论