基于图卷积神经网络的航站楼旅客流时空分布预测

2024-01-17 12:48丁新伟刘骐畅

中国民航大学学报 2023年6期

丁新伟，秦倩，阚犇，刘骐畅，贾驰

（1.首都机场集团有限公司国际科技部，北京 101300；2.中国民航大学电子信息与自动化学院，天津 300300）

随着中国民航业整体稳健向前发展，机场依然需要解决航站楼旅客流与综合交通区的合理接驳问题，以达到对航站楼旅客的高效疏散并提高机场运行效率[1-3]。实现航站楼旅客的时空分布预测，可准确获取旅客的人员密度、关键节点人数等信息，为综合交通区运力的合理调配提供依据。航站楼旅客流的预测本质上属于时空序列预测问题，即基于历史时期内的客流时空分布数据，预测当前和未来一段时间内的演化情况。目前，专门针对航站楼旅客流预测的研究较少，主要包括ARIMA 模型[4]、K 近邻算法[5-7]、支持向量机回归[8]等，且大多只基于整体或单一区域的旅客流序列，并只利用了整体或单一区域的时间信息，未利用空间信息，这样的结果很容易由于其他区域的旅客流变化造成预测准确性下降。而在公路、地铁站等场景的交通流预测研究中，卷积神经网络被用于提取交通流的空间特征，但将待预测区域划分为尺寸相同的网格并统计各个网格中的流量，不符合交通流量数据的真实空间特征[9]。

针对目前研究的不足，本文提出一种基于神经网络即结合图卷积和门控循环单元[9-12]（GCGRN，graph convolutional gated recurrent network）的航站楼旅客流时空分布预测方法，结合航站楼内部空间拓扑结构，挖掘各空间区域内客流变化的内在机理，捕获楼内各空间区域客流变化的时空相关性；利用登机口变化导致航站楼内客流分布改变的条件，提高预测方法的精度与可解释性。

1 旅客流预测原理及模型

1.1 旅客流预测问题定义

根据航站楼GIS（geographic information system）地图并结合楼内各个空间区域与设施分布特点，将空间区域简化为节点如图1 所示，相邻空间区域使用无向边相连，生成由节点和无向边组成的邻接拓扑图G=（V，E，A），其中V=为节点集合，N 为节点数量，E 为一组无向边集合，A∈RN×N为根据每对节点之间的距离构造的邻接矩阵。特征矩阵Xt∈RN×N为拓扑图G 在时间t 的旅客流量。综上，航站楼旅客流预测问题可以定义为拓扑图G和特征矩阵X 的映射函数f()，其映射关系如下

图1 简化后的航站楼空间结构示意图Fig.1 Schematic diagram of the simplified spatial structure of the terminal building

式中：n 表示输入时间序列的长度，即历史时刻；T 表示输出预测序列的长度。

1.2 图卷积

图卷积神经网络本质在于提取网络中的空间特征，目前图卷积方法主要分为两类：基于谱的图卷积和基于空间域的图卷积。上述结构属于拓扑图，由节点和无向边组成，包含了节点本身的节点特征以及节点间的结构特征，并且可以构成拓扑图的邻接矩阵，综上，采用基于谱的图卷积方法研究航站楼网络的空间特征。

基于谱的图卷积主要是对图进行傅里叶变换，将图信号从空间域转为谱域，再对其进行卷积运算。基于谱的图卷积表示如下

式中：L∈RN×N为图的拉普拉斯矩阵；I∈RN×N为单位矩阵；D∈RN×N为A 的度矩阵，其对角线上的元素是各节点的度数；U∈RN×N为L 的特征向量矩阵，T 为转置；Θ 为图卷积核；*φ 表示图卷积算子；x∈RN表示输入的旅客流量空间特征向量；Λ=diag（λ0，λ1，…，λN-）1∈RN×N为对角矩阵，其中λi为L 的特征值；Θ（Λ）是一个滤波器，其实质是一个对角矩阵。

1.3 模型结构

图卷积神经网络模型分为两个部分：卷积神经网络（GCN，graph convolutional network）和门控循环单元（GRU，gated recurrent unit），如图2 所示。由式（1）可知，将历史n 个时刻旅客流分布的时间序列数据输入图卷积网络，提取网络拓扑结构，得到空间特征；接着再将带有空间特征的时间序列输入GRU 中，提取出航站楼内待预测时刻未来T′个时刻的旅客流特征矩阵Y；最后输入全连接层，输出预测结果。

图2 旅客流预测过程拓扑图Fig.2 Topology of passenger flow forecasting process

1.3.1 空间特征模型

卷积神经网络在傅里叶变换中加入滤波，作用于顶点及其一阶邻域上，达到提取顶点间空间特征的目的。如图3 中，假设网络中的节点1 是顶点。GCN 模型可以通过中心节点和其周围节点的隐藏关系来获取空间特征。采用GCN 模型学习空间特征，即

图3 1 号节点的邻接特征Fig.3 Adjacency features of node 1

式中：X 为旅客流量x 的傅里叶变换，即特征矩阵；m表示切比雪夫网络（谱卷积网络结构）第m 层；ReLU为激活函数=A+I；D 为A 的度矩阵；W 为神经网络中的可训练权重矩阵。

1.3.2 时间特征模型

GRU 在循环神经网络（RNN，recurrent neural network）的基础上设计了门控结构，使得信息在隐藏层可以有选择性地传递，并记忆重要信息，以及解决长时间序列训练过程中出现的梯度消失和梯度爆炸问题。GRU 由重置门和更新门两个部分构成，所含参数少且收敛速度快。状态在GRU 中从前向后单向传输，且只可以使用当前的输入与之前的上下文信息，GRU结构如图4 所示，其数学表达式如下

图4 GRU 结构Fig.4 GRU structure

式中：通过t 的上一时刻隐藏状态ht-1和当前时刻的旅客流信息xt获取两个门控状态；zt表示更新门，来控制上一时刻信息影响当前时刻的程度；rt表示重置门，来控制忽略上一时刻信息的程度；σ 为Sigmoid函数，可将数据变换为0～1 范围内的数值，充当门控信号；W（z）和W（r）分别为更新门和重置门中xt的权重系数。GRU 将上一时刻的隐藏状态和当前时刻的旅客流信息作为输入，以此来获得下一时刻的旅客流状态。获取当前时刻旅客流信息的同时，可保留上一时刻的旅客流信息，且仍有能力提取时间特征。

2 基于GCGRN 模型的旅客流预测方法

2.1 样本生成方法

为了更便捷地实现GCGRN 模型的输入，将各个时间切片内的旅客流作为样本，对航站楼内监控摄像头采集的视频图像整合并得到航站楼内各个空间区域旅客流的时间序列，构造各个时间切片内的旅客流时间分布向量H，方法如下。

选取航站楼内能够覆盖关键换乘、排队区域的监控摄像头，按固定间隔对这些监控摄像头采集的视频图像进行截图，每个截图作为一个时间切片，然后从每个时间切片中得到该时刻、该监控摄像头覆盖空间区域内的旅客流，并对监控摄像头进行编号、排序，构造每个时间切片内的旅客流时间分布向量H，其分量分别为各个空间区域在每个时间切片内的旅客流，具体步骤如图5 所示。

图5 样本生成步骤流程图Fig.5 Flow chart of sample generation steps

2.2 旅客流时空分布预测方法

以航站楼内旅客历史时空分布为基础，选取历史运营日各时间切片内的旅客流分布序列作为训练序列对预测日的目标时刻旅客流预测，设计了基于图卷积神经网络的时空分布预测方法。

定义1对邻接拓扑图中的节点编号，创建两个维度都是节点编号的一个二维矩阵，若编号为i，j 的两个空间区域相连，则在上述二维矩阵中，（i，j）元素对应的数值为1；若编号为i，j 的两个空间区域不相连，则在上述二维矩阵中，（i，j）元素对应的数值为0，将标注了各个元素对应数值后的二维矩阵作为区域邻接矩阵A。

定义2设度矩阵可表示为则图卷积的计算公式为

定义3设第t 个时刻的空间特征向量与上一个时刻门控循环单元的状态分别经过线性变换后相加，经Sigmoid 激活函数处理，得到值域为（0，1）的更新门zt的值如下

式中：xt为第t 个时刻的空间特征向量；W(z)为第t 个时刻的空间特征向量xt的权重矩阵；ht-1为第t-1 个时刻门控循环单元的状态；V(z)为第t-1 个时刻门控循环单元的状态ht-1的权重矩阵。

同样地，使用另一组t 个时刻的空间特征向量xt的权重矩阵W(r)和第t-1 个时刻门控循环单元的状态ht-1的权重矩阵V(r)，得到值域为（0，1）的重置门rt的值如下

对重置门rt的值进行线性变换，得到当前记忆ht′的值如下

式中，⊙为Hadamard 乘积。再结合更新门zt的值和当前记忆ht′的值，获得输出信息ht如下

共进行T 组门控循环单元的操作，对T 组门控循环单元的输出信息经全连接层进行整合，得到航站楼内待预测时刻未来T′时刻的特征矩阵，Y1=（Yt+1，Yt+2，…，Yt+T）′，其中Yt+1，Yt+2，…，Yt+T′分别为待预测时刻未来T′个时刻的旅客流特征向量。

定义4设从待预测时刻开始，未来2 h 内有M 架航班起飞，使用每架航班的计划登机口与前一天使用的登机口数据，构建一个二维矩阵，若某航班当天使用的登机口为p，前一天该时间内使用的登机口为q，则在上述二维矩阵中，（p，q）元素对应的数值为1；否则，在上述二维矩阵中，（p，q）元素对应的数值为0，将标注了各个元素对应的数值后的二维矩阵作为表示登机口变化的邻接矩阵k。

由航站楼内客流分布的历史数据，得到前一天中对应于待预测未来T′个时刻的旅客流特征矩阵，Y′=（Y′t+1，Y′t+2，…，Y′t+T）′，其中Y′t+1，Y′t+2，…，Y′t+T′分别为前一天中对应于待预测未来T′个时刻的旅客流特征向量，然后结合上述表示登机口变化的邻接矩阵k，分别进行K 次图卷积操作，获得输出信息

式中：Si(l)为第l 次迭代产生的旅客流特征向量，S(0)=Y′；

将K 次图卷积操作的输出信息经全连接层进行融合，得到由登机口变化引起的旅客流特征矩阵Y2=其中分别为由登机口变化引起的旅客流特征向量。

建立针对航站楼旅客流预测的GCGRN 模型，该模型具体步骤如下：

步骤1结合航站楼内各个空间区域与设施分布特点，将空间区域信息简化为图结构数据，并构造区域邻接矩阵A；

步骤2基于样本生成中的旅客流时间分布向量H 和步骤1 获得的区域邻接矩阵A，通过图卷积网络在图结构数据上进行图卷积操作，获得空间特征向量；

步骤3将上述步骤2 由图卷积网络提取的空间特征向量输入门控循环单元中，提取出航站楼内待预测时刻未来T′个时刻的旅客流特征矩阵Y1，如图6 所示；

图6 待预测时刻的旅客流特征矩阵示意图Fig.6 Schematic diagram of the passenger flow characteristic matrix at the moment to be predicted

步骤4由航班计划及航班历史数据，得到待预测时刻未来2 h 内起飞航班使用的登机口p 及该航班前一天使用的登机口q，构造表示登机口变化的邻接矩阵k，将前一天对应于待预测时刻的未来T′个时刻的旅客流特征矩阵输入图卷积网络进行图卷积操作，获得由登机口变化引起的旅客流特征矩阵Y2，如图7所示；

图7 由登机口变化引起的旅客流特征矩阵示意图Fig.7 Schematic diagram of the passenger flow characteristic matrix caused by the change of the boarding gate

步骤5将步骤3 获得的航站楼内待预测时刻未来T′个时刻的旅客流特征矩阵Y1和步骤4 获得的由登机口变化引起的旅客流特征矩阵Y2进行融合，通过不同的权重加权求和得到最终预测的旅客流特征矩阵如下

式中：F1、F2为权重系数且F1+F2=1。F1表示旅客携带行李量；F2表示航班信息，不同时间段内航班信息，不同旅客携带行李量不同，以此为限制条件进行自动迭代，寻找最优F1、F2权重值。

3 实验与分析

3.1 实验环境

本实验使用Python 3.7 基于PyTorch 1.7.1 实现，使用Windows10 操作系统，CPU 为Intel Xeon E5-2680 v4@2.40GHz*14，GPU 为NVIDIAGeForceRTX3080Ti，内存64 GB。

3.2 评价指标

为了验证GCGRN 模型预测效果，将最终预测的旅客流与真实旅客流进行比较，并利用均方根误差[10]（RMSE，root mean squard error）、平均绝对误差[10]（MAE，mean absolute error）以及拟合优度R2[13]作为评价指标，对比较结果进行衡量，3 种评价指标数值越小表示模型预测效果越好。

3.3 结果分析

为了探究2.2 节建立的GCGRN 模型在旅客流预测的适用性，本文从方法维度进行验证分析。选择某大型机场5 天运行日作为预测日，将每日划分为48个时段，并与传统K 近邻（KNN，K-nearest neighbor）模型[5-7]、自回归求和滑动平均（ARIMA，autoregressive integrated moving average）模型[4]、支持向量机（SVM，support vector machine）模型[8]以及待预测时刻的旅客流特征矩阵Y1与由登机口变化引起的旅客流特征矩阵Y2分别单独作用时作对比。

某天各预测方法仿真对比图，如图8 所示。5 日平均评价指标均方根误差RMSE、平均绝对误差MAE 及拟合优度R2如表1 所示。

表1 5 日平均评价指标Tab.1 Five-day average evaluation index

图8 不同预测方法预测值与真实值对比Fig.8 Comparison of the predicted value of different models with the actual value

由图8 和表1 可以看出，待预测时刻的旅客流特征矩阵Y1与由登机口变化引起的旅客流特征矩阵Y2分别单独作用时，预测精度均不如GCGRN 模型，且KNN 模型的评价指标RMSE 与MAE 均小于ARIMA模型并均相差2.0，拟合优度R2比ARIMA 模型高2.66个百分点，说明KNN 模型对航站楼旅客流预测效果好于ARIMA 模型，这是由于ARIMA 模型只适用于平稳的时间序列，对于像航站楼旅客流这种非线性且复杂的实际问题，预测效果就会大打折扣。SVM 模型虽然能较好地解决非线性时间序列问题，各项评价指标都优于ARIMA 模型且与KNN 模型十分接近，但不易确定模型参数，预测精度取决于核函数，参数调整费时费力，难以帮助航站楼对资源进行实时配置。

相较于上述传统模型，GCGRN 融合图卷积神经网络与门控循环单元，将历史运营日的各时间切片内的旅客流时间分布序列作为训练序列来对预测日各时间段旅客流进行预测。该模型极大程度地规避了天气、节假日等一系列外界因素对航站楼旅客流造成的影响，较其他模型具有更高的预测准确率。

从以上3 种评价指标来看，GCGRN 的评价指标RMSE 与MAE 均低于其他3 种模型，以MAE 为例，其值低于其他3 种模型的均差为4.507，且拟合优度R2为4 种模型最高，平均提高7.58 个百分点，证明了GCGRN 对航站楼旅客流预测具有更好的效果。

4 结语

本文从时间和空间两个维度对航站楼旅客流进行建模，构建了基于图卷积神经网络的航站楼旅客时空分布预测模型，并提出利用门控循环单元提取时间特征。最后结合某机场航站楼实际旅客流数据开展航站楼旅客流的预测探究，研究表明：

（1）GCGRN 模型充分利用航站楼内部的空间拓扑结构，深度挖掘航站楼内各空间区域内客流变化的内在机理，更好地捕获了航站楼内各空间区域客流变化的时空相关性；

（2）GCGRN 模型利用了登机口变化导致航站楼内客流分布改变的条件，使得预测方法的精度更高，可解释性更强，机场运营方可依据本方法调整登机口以调控客流分布，提高服务质量。

GCGRN 模型虽然对航站楼旅客流提供良好的预测效果，但不同时间、地点以及航班计划均会影响聚集效果。未来随着机场路侧综合交通带来的数据完善与补充并建立更加完善的航站楼旅客特征体系，可以进一步提升基于GCGRN 模型航站楼旅客流预测模型的精确度与普适度。