基于前后文关联的长短期记忆网络模型Contextual LSTM的交通流数据预测

2024-05-13 16:08吴澍
信息系统工程 2024年4期

吴澍

摘要:为改善交通拥堵情况,提升交通网络效率,提出了基于前后文关联的长短期记忆网络模型Contextual LSTM。首先,针对长短期记忆网络模型面对突发情况识别不及时的问题,将输入和隐藏状态建立关联关系,提升前后时刻数据的关联,从而提升模型应对突发情况的能力。此外,采用英国的交通数据集对模型进行训练与测试,并与传统LSTM模型、GRU模型进行预测效果对比实验。验证结果表明,改进后的长短期记忆网络模型在交通流数据的预测上更具优势。

关键词:长短期记忆网络;交通流预测;前后文关联

一、前言

据公安部统计,我国2023年机动车保有量达4.35亿辆。机动车数量的增长速度已高于基础设施完善的速度,交通问题成为城市高质量发展的瓶颈[1]。为解决这一问题,各大城市纷纷采用机器学习、物联网等科学技术研究更高效的智能交通系统,从而提升城市运行效率[2]。实时准确的交通流数据和预测是智能交通系统的关键。交通规划、管理部门可以基于实时准确的交通预测信息科学,灵活地设计道路、部署交通资源、引导交通流量等;出行者则可以选择合适的出行时间和工具,避免拥堵的发生[3]。

交通流预测的模型可分为三类:统计方法模型、传统机器学习模型和深度学习模型。相较前两种模型,深度学习模型的优点是可以自动提取特征、处理复杂非线性问题、综合考虑交通流数据的历史规律性和路网的空间相关性,精度较高,算法成熟。深度学习模型包括卷积神经网络模型(CNN)、循环神经网络模型(RNN)和长短期记忆网络模型(LSTM)。这些模型通过模拟人脑神经元连接方式或处理序列数据的机制来进行预测。CNN特别适合处理图像和序列数据,通过模拟人眼视觉神经的工作方式提取数据特征;RNN适用于处理序列数据,通过在时间维度上重复应用相同的计算过程来学习序列数据的内在模式;LSTM是RNN的一种变体,通过引入“记忆单元”来解决RNN处理长序列时的梯度消失问题,能够更好地处理长时间序列的预测。LSTM模型的复杂性使得其可解释性较差,且面对难以量化的外部因素影响,特别是突发情况时存在识别不及时问题,使得交通流预测受到限制。

本文选择深度学习模型中的应用于预测领域的LSTM模型进行交通流预测的研究,针对LSTM模型面对突发情况识别不及时的问题,将模型输入和隐藏状态建立关联关系,提升前后时刻数据的关联,提出Contextual LSTM模型并且通过实验验证该模型在交通流预测的优势。

二、LSTM模型的理论基础

长短期记忆网络模型(Long Short-term Memory, LSTM)是一种特殊的循环神经网络(Recurrent Neural Network,RNN),通过门控状态控制传输状态,记住重要的信息,忘记不重要的信息,解决了梯度消失和爆炸的问题,并且在长序列上有更好的表现,更适用于交通流这种长时间的预测。

LSTM模型有两个传递状态,一个细胞状态Ct,一个隐藏状态ht,通常细胞状态变化比较缓慢,隐藏状态传递的过程中变化比较快。xt和yt分别代表输入和输出。LSTM模型的数据传递见图1。

LSTM模型的内部主要有三个阶段:忘记阶段、选择性记忆阶段以及输出阶段。对应门控电路为遗忘门、输入门、输出门。LSTM模型内部结构见图2。

三、Contextual LSTM模型构建

经典的LSTM虽然处理时间序列预测的效果较好,但是对于前后文的关联关系建立不足,例如,遗忘门、输入门对上一时刻记忆细胞的状态感知不足。针对这一问题,本文将前一时刻记忆细胞的状态作为遗忘门、输入门的输入,从而提升前后文的关联,Contextual LSTM内部结构见图3。

四、实验结果与分析

(一)数据来源和实验环境

本实验的数据为英国交通网中的3组交通流数据,时间跨度分别为2019年4月1日至2019年4月20日、2019年4月21日至2019年5月10日、2019年5月11日至2019年5月31日,数据集中相邻数据的时间间隔为5分钟,3组数据集中的数据数目均为1600组。实验将数据集的前600条数据作为训练集,后1000条数据作为测试集。

实验的笔记本电脑型号为Lenovo-G50,Windows 10,64位,CPU型号为Intel (R) Core(TM) i7,采用的IDE为pycharm,编程语言为python,python的版本为3.9.1。

(二)模型评价指标

为全方位评估本文提出的基于前后文关联的长短期记忆网络模型的效果,选用平均绝对误差(MAE)、平均方根误差(RMSE)、平均绝对百分误差(MAPE)进行预测评估,三者数值越低代表模型预测精度越高、预测效果越好。

MAE、RMSE、MAPE侧重点有所不同,可以从不同角度评估模型的效果。MAE和RMSE衡量的是真实值与预测值偏离的绝对大小情况,需要结合真实值的量纲才能判断差异;MAPE衡量的是偏离的相对大小,即百分率,更容易理解和解读。相对来说,MAE和MAPE不容易受极端值的影响,而RMSE采用误差的平方,会放大预测误差,所以对于离群数据更敏感,可以突出影响较大的误差值[4-5]。三者表达式如下:

(三)预测结果与分析

本文采用Contextual LSTM模型对交通流数据集进行预测。针对三组数据集,分别用传统LSTM模型、GRU模型,以及本文提出的Contextual LSTM模型对本文的交通流数据集进行了预测效果验证。3组数据集的实验结果见图4、图5、图6。

从预测效果对比图可以看出,Contextual LSTM模型的预测效果最佳,预测的结果最贴近于真实数据,其次是GRU模型,最后是LSTM模型。除预测效果对比图,本文还对三种模型的MAE、RMSE、MAPE数值进行了对比,见表1。

为对比结果更直观,本文还绘制了条形统计图进行对比,见图7。由图7、表1,以及预测效果对比图可见,Contextual LSTM模型相比于LSTM模型和GRU模型,其预测误差最小,预测精度最高。相比于LSTM模型,Contextual LSTM模型的MAE、RMSE、MAPE 3种指标分别优化了9.8×10-4、1.73×10-3、9.9×10-4;相比于GRU模型,Contextual LSTM模型的MAE、RMSE、MAPE 3种指标分别优化了4.3×10-4、1.39×10-3、5.8×10-4。

五、结语

随着交通拥堵的频发,交通数据的预测成为交通路网的研究重点。针对LSTM模型前后文关联关系不强的问题,本文提出了基于前后文关联的长短期记忆网络模型Contextual LSTM,将上一时刻的记忆细胞的状态反馈给遗忘门和输入门,将输入和隐藏状态建立关联关系,提升前后时刻数据的关联,从而提升模型应对突发情况的能力。本文首先对Contextual LSTM模型的原理进行了具体的分析,然后采用英国交通路网的3组数据集对模型进行了效果驗证,并和传统LSTM模型以及GRU模型进行了预测效果对比,通过对比展示了Contextual LSTM模型良好的性能,为交通路网中交通流的预测提供了参考依据。

参考文献

[1]李文龙,林思畅,陈翰林,等.一种智慧便捷停车系统设计[J]. 中国科技信息,2023(06):99-101.

[2]薛延明,李光辉,齐涛.融合图小波和注意力机制的交通流预测方法[J].计算机科学与探索,2023,17(06):1405-1416.

[3]周邯.基于视频分析的城市道路短时交通流预测[D].重庆:重庆大学,2023.

[4]于海波,王春雨,袁晓蕾,等.基于PCA-SVR的电能计量装置误差评估算法[J].电测与仪表,2020,57(19):140-145.

[5]赵鹏,马克琪,李红斌,等.计及一次电压波动的电压互感器误差状态在线评估方法[J].高电压技术,2022,48(03):1042-1051.

责任编辑:张津平、尚丹