融合VGG与FCN的智能出租车订单预测模型

2020-12-16 02:18裴春营袁瑶瑶
计算机工程 2020年12期
关键词:栅格出租车订单

李 浩,霍 雯,裴春营,袁瑶瑶,康 雁

(1.云南大学 软件学院,昆明 650091; 2.云南省软件工程重点实验室,昆明 650091;3.西安科技大学 测绘科学与技术学院,西安 710054)

0 概述

随着共享经济和移动物联网技术的不断发展,出租车时空轨迹、人群流动行为等[1]新型城市轨迹数据应运而生,与传统轨迹数据相比,新型轨迹数据的空间分布更广、维数更高且数据量更大[2]。在当前智能交通中,虽然众多乘车APP在一定程度上缓解了外出乘车难的问题[3],但是出租车司机接客难、乘客在上下班高峰期乘车难的问题仍然存在。因此,如何从海量乘客出行轨迹数据中提取具有价值的数据解决上述问题,成为国内外研究人员关注的热点[4]。

目前全球定位系统(Global Positioning System,GPS)在交通出行中应用较广泛,该系统以一定的频率向交通信息沟通平台发送当前车辆的经度、纬度、时间、速度、方向以及载客状态等轨迹数据[5],这些数据包含乘客的出行规律、兴趣点分布等信息。利用GPS获取的出租车轨迹数据可分析得到不同区域内车辆载客量分布特征,并由此预测城市居民流动趋势[6],这为交通路线优化、出行路线个性化推荐、 路网预测以及城市规划等提供了理想的解决方案。

本文基于出租车GPS获取的海量出租车时空轨迹数据,提出一种融合VGG网络和全卷积网络(Fully Convolutional Networks,FCN)的出租车订单预测模型。将出租车轨迹数据通过计算转换为订单图像,利用VGG网络提取不同区域出租车客流分布特征,并采用FCN中反卷积层上采样重构订单图像,对不同区域与时间段的订单进行预测,最终得到订单数据分布图。

1 相关工作

近年来,为更好地解决出租车空载率高、出租车司机寻客难等问题,研究人员进行了相关研究。文献[7]利用出租车轨迹数据学习乘客上下车行为特点,为出租车司机和乘客设计推荐系统,建立利润概率模型表示乘客位置与出租车到达时间,出租车司机根据该模型输出结果选择乘客与运送路线。文献[8]基于出租车GPS轨迹数据,通过分析城市热点区域和乘客出行规律创建Taxi-RS系统为出租车司机推荐寻客路线。文献[9]对遗传算法进行改进,提出一种三阶段方法解决出租车停靠站选址问题,利用地理信息系统平台从出租车全球定位系统数据中收集出租车需求热点,从而确定出租车停靠站最佳区域,再根据出租车需求与出租车停靠站之间的空间互动关系得到需求分段,并沿道路两侧生成候选停靠站,建立出租汽车站场选址模型,使乘客出行成本与出租汽车站建设成本最小。该方法可有效解决出租车停靠不合理导致其利用率低的问题,也有利于城市交通规划建设。文献[10]利用GPS轨迹数据研究出租车载客信息并提出对出租车可能停靠位置进行定位的探测算法,可有效帮助出租车调度系统更合理地为乘客安排距离最近的车辆。文献[11]设置乘客出行频率、出租车需求热点以及出租车里程等重要指标,通过对大量出租车历史运行轨迹的分析提出营运策略,使出租车利润最大化。文献[12]通过分析大量出租车历史运行轨迹数据,为出租车提供更好的客源寻找策略。

随着智慧交通的不断发展,研究人员提出更加精细化的聚类方法对城市热点区域进行划分。文献[13]利用长短期记忆(Long Short-Term Memory,LSTM)网络对未来订单的需求值与近时间点之间的相关性进行时间建模,即使用局部卷积神经网络(Convolutional Neural Networks,CNN)对局部空间之间的相关性建模,并对共享相似时间模式区域之间的相关性建模,最终提出基于深度多视角时空网络(Deep Multi-View Spatial-Temporal Network,DMVST-Net)的时空关系模型,基于大量出租车实际需求数据的实验结果表明,DMVST-Net模型在预测网约车的需求任务中优于现有的其他方法。文献[14]采用出租车历s史运行轨迹数据设计基于机器学习的智能出租车预测系统,利用回声状态网络算法预测出租车出行目的地并使用随机森林算法预测抵达时间,从而更合理地调度出租车资源,有效减少资源浪费。文献[15]提出结合遗传算法和短期交通预测策略的GACE方法,可有效预测美国加利福尼亚州高速公路的交通拥堵情况。为预测短期交通流量,文献[16]提出集成粒子群算法与人工神经网络的创新算法,可及时提供交通流预测信息,减少交通拥堵并提高运输流动性。文献[17]提出用于预测交通流状况的算法,将贝叶斯组合模型与经典单时间序列模型的短期交通预测性能进行对比,线性回归组合模型较贝叶斯组合模型预测结果更准确。文献[18]提出基于时空相关性的Conv-GRU方法,使用卷积-门控循环单元提取交通流量的空间和时间特征,利用双向门控循环单元获取交通流周期性特征,融合上述特征得到短时交通流量预测值[19]。文献[20]提出一种序列学习模型,基于LSTM网络由存储于某区域的出租车历史运行信息预测该区域在未来某时间段的出租车需求量。

2 模型建立与分析

2.1 相关定义

定义1(区域) 区域是基于真实地图划分的栅格区域,通常根据经度和纬度范围将中心城区分为多个栅格。例如,将中国成都的城市区域分为24×24个栅格区域,每个栅格大小为1 km×1 km,如图1所示;美国纽约的城市区域分为16×8个栅格区域,每个栅格大小为1 km×1 km。

图1 栅格区域示例Fig.1 Example of grid area

定义2(起点和终点) 起点和终点(Origin and Destination,OD),用于描述城市交通中一定时间范围内所有出行起点和终点之间的出行交通量。OD数据主要反映居民从一个区域到另一个区域的动态迁移状况,在一定程度上体现了居民的出行情况。图2为居民从O点到D点的出行轨迹点,轨迹点外部的网格为栅格区域,OD表示忽略中间轨迹点只保留起点和终点,起点O所在的栅格区域内有一个出租车订单。

图2 居民的出行轨迹Fig.2 Travel trajectory of resident

定义3(出租车订单预测) 出租车订单预测是根据t时刻之前的出租车订单数据对t+Δt或者t+xΔt时刻订单数量的预测,其中,Δt为时间间隔,x=1,2,…,n。订单预测旨在估计给定区域和时间间隔的出租车订单数量。出租车运营状态分为空载状态和载客状态,在载客状态中,以出租车在特定区域所接到的订单数量为研究对象,即订单行程起止点分别为O点和D点,主要研究O点所在区域内出租车接到的总订单数。出租车从接到乘客(上车)到将乘客送达目的地(下车)表示一次订单完成,即乘客完成从O点到D点的迁移。

2.2 模型框架

将城市用栅格划分为m×n的矩阵,每隔一定时间经过计算得到一张出租车订单图像,利用卷积神经网络提取订单图像数据的空间依赖特征进行订单预测。

2.2.1 基于VGG网络的特征提取

交通系统是一种复杂、动态且高度相关的网络[21-22],采用传统人工神经网络[23-25]和时间序列方法[26-28]难以提取图像空间依赖特征[29-30],而利用卷积神经网络可有效提取该特征[31-33]。本文将出租车订单数据通过区域划分和计算转换为订单图像,如图3所示,其像素值相当于空间区域的订单数量,栅格区域内数值代表出租车订单数量。出租车在某区域接到订单后将乘客送达目的地,由于其在目的地及其附近区域再次接到订单的可能性较大,因此利用CNN提取该空间依赖特征。在图3中,每个方格代表真实的地图栅格,通过经度和纬度范围控制地图栅格范围,其中标注21数值的区域表示该时间段有21个订单,下一个时间段该区域的订单很有可能来自相邻区域或者其他区域的出租车,利用CNN局部感知视野可有效提取出租车的空间流动模式与空间依赖特征。

图3 出租车订单图像Fig.3 Image of taxi order

在卷积神经网络中,假设二维图像I为输入,K为二维卷积内核,S为输出,则所输入图像的互相关表达式如下:

S(i,j)=(I*K)(i,j)=

(1)

在卷积神经网络中实现的互相关如式(1)所示,互相关与卷积类似,卷积需将卷积核翻转后再进行点乘,而互相关与卷积运算方式基本一致,但是未对核进行翻转。卷积表达式如下:

S(i,j)=(K*I)(i,j)=

(2)

与传统的手动提取特征相比,卷积神经网络可自动有效地提取图像特征,因此被广泛用于图像分类、分割及目标检测等多个领域,特别是全图分类方面[27-28,31]。

VGG网络[34]使用非常小的3×3卷积核增加网络深度,仅需少量几次迭代就能实现模型收敛,因其具有良好的拟合性能,在图片分类中常被用来提取图像特征。本文采用VGG网络的主要结构,在订单图像中运用卷积层和池化层来提取特征。

1)卷积层。假设第k层为卷积层,第k-1层为池化层或者输入层,则第k层卷积的计算公式如下:

(3)

2)池化层。假设第k层为池化层,第k-1层为卷积层或者输入层,则第k层池化的计算公式如下:

(4)

其中,down()为下采样函数,β为权重参数。

由于VGG网络中模型参数主要集中在全连接层,导致网络参数增加且网络训练速度变慢,因此本文模型去掉全连接层,采用VGG网络主要结构提取特征,包括6个3×3的卷积层和3个池化层。经过卷积层处理后输出特征图与输入特征图像在空间维度上保持一致,每次池化后特征图大小缩减一半。此外,1个5×5的卷积核可用2个3×3的卷积核近似代替,1个7×7的卷积核可用3个3×3的卷积核近似代替,上述近似替代可增加非线性变换,从而提高网络深度及判别函数的识别能力并减少参数量。

2.2.2 FCN网络重构

全卷积网络可用于图像的语义分割。本文采用FCN网络的上采样结构,对卷积处理后的图像分别进行8倍、16倍、32倍的上采样。其中,32倍上采样图像只能实现基本还原,需要16倍和8倍上采样补充图像细节,8倍上采样图像较原始图像更模糊和平滑。由于本文中图像的像素值表示出租车收到的订单数量,而原始图像较粗糙,因此重构图像不需补充细节。图像上采样主要利用反卷积操作实现,反卷积在反卷积核特征图的作用下通过反池化使稀疏的特征图变得密集,这是将特征图还原至原像素空间的过程[30]。

传统卷积和反卷积分别如式(5)和式(6)所示:

F=X⊗Y

(5)

X=F⊗Y

(6)

其中,X为原图像,Y为卷积核,F为卷积后的特征图。

本文卷积和反卷积分别如式(7)和式(8)所示:

F=Xt⊗Y

(7)

Xt+1=F⊗Y

(8)

其中,Xt为t时间段出租车订单图像,Xt+1为t+1时间段出租车订单图像。将出租车订单数据转换为时间序列图像,利用t时刻的订单图像重构出t+1时间段的订单图像,即利用反向传播调整卷积核和反卷积、激活函数等权重,重构出租车订单数据的具体分布,以预测下一个时间间隔内多区域的订单图像。

反卷积层对最后一个卷积层的特征图进行上采样,使其恢复到与输入图像相同的尺寸,从而对每个像素进行预测,并保留原始输入图像的空间信息。 传统上采样重构图像是恢复原始图像像素结构,而本文是重构下一个时间段订单图像,即预测下一个时间段订单信息,最终输出含有订单信息的图像。

2.2.3 融合模型预测

本文VGG-FCN融合模型结构如图4所示,采用VGG网络对大小为24×24的原始图像进行卷积和池化操作后得到抽象的特征图,多次重复该操作可得到更抽象的特征图,再经过多层反卷积重构出预测图像,从而获得各地区出租车订单预测结果。

图4 VGG-FCN融合模型结构Fig.4 Structure of VGG-FCN fusion model

传统VGG和FCN模型主要用于图像分类与分割,而本文所提VGG-FCN融合模型用于回归预测,输入和输出均为相同尺寸的图像。本文采用VGG结构中卷积层、池化层、BN批量标准化结构、ReLU函数以及FCN结构中上采样重构结构(VGG和FCN均不含全连接结构)。

将出租车订单数据进行地理栅格划分,每隔一段时间根据订单数据计算得到一张订单数据图像并将其按时间顺序排列。采用VGG提取图像特征并生成多张特征图,接入反卷积层进行2倍、4倍、8倍的上采样重构。重构图像表示为:

y=x⊗K

(9)

其中,y为重构图像,x为原始图像,⊗为反卷积操作,K为反卷积核。

代价函数表达式为:

(10)

3 实验与结果分析

3.1 数据集

本文实验环境为Tesla P4 2核8 GB机器,采用图形处理器(Graphics Processing Unit,GPU)对本文提出的模型进行训练。使用TaxiCD、BikeNYC1和BikeNYC2共3组不同的数据集。其中,TaxiCD数据集是2014年8月1日至8月30日中国成都市14 000辆出租车GPS轨迹数据,该数据集包含10亿个GPS点(车辆行驶轨迹每隔10 s~每隔60 s有1个GPS点)信息,GPS点信息包含出租车所在位置的经度、纬度、每个GPS点返回的时间以及出租车载客状态,其中1代表已载客,0代表无载客。根据区域和出租车订单预测定义处理数据得到出租车订单图像。将该数据集中最后2天的数据作为测试集,其他数据作为训练集。

BikeNYC1数据集和BikeNYC2数据集是从纽约市共享自行车系统获取的行程持续时间、行程开始和结束站点ID以及行程开始和结束时间等行程数据。其中,BikeNYC1数据集是2015年4月1日至8月31日纽约共享自行车GPS轨迹数据,BikeNYC2是2016年3月1日至2016年7月31日纽约共享自行车GPS轨迹数据。自行车虽然流动性不如出租车,但是其同样具备GPS轨迹特性和订单接收系统,以开锁骑车作为订单开始,以到达目的地锁车作为订单结束,因此可用自行车订单数据模拟出租车订单数据,乘客开锁使用自行车相当于出租车接收乘客,乘客骑自行车到目的地后锁车相当于出租车运送乘客到达目的地。在BikeNYC1数据集和BikeNYC2数据集中,以最后10天的数据作为测试集,其他数据作为训练集。TaxiCD、BikeNYC1和BikeNYC2数据集的具体信息如表1所示。

表1 3种数据集的具体信息Table 1 Specific information of three datasets

3.2 实验模型

本文选择4种模型与本文VGG+FCN融合模型进行对比,以下对这5种模型进行介绍。

1)BP(Back Propagation)模型。BP模型是采用误差逆向传播算法训练的多层前馈神经网络模型,划分地图栅格区域个数为24×24,共576个区域,将24×24区域中的订单数据转换为24×24的矩阵,可将该矩阵转换为一维向量进行预测。

2)RBF(Radial Basis Function)模型。RBF模型是一种径向基神经网络模型。

3)CNN模型。利用CNN提取图像特征,再接入全连接层进行预测。

4)SARIMA(Seasonal Autoregressive Integrated Moving Average)模型。SARIMA模型是一种季节性差分自回归滑动平均模型,可用于时间序列预测分析。通过SARIMA对每个预测区域建立一个预测模型。

5)VGG+FCN融合模型。该模型采用VGG主要结构提取特征,并选用FCN的上采样结构通过反卷积重构下一个阶段的预测图像。

3.3 评价指标

本文以平均准确率(ACC)和均方根误差(Root Mean Square Error,RMSE)作为订单预测评价指标,计算公式如下:

(11)

(12)

(13)

(14)

其中,fi为预测值,yi为真实值,Average为样本中每个区域的平均订单数,n为预测区域的数量。

3.4 结果分析

将BP、RBF、CNN、SARIMA模型与本文VGG+FCN融合模型在TaxiCD数据集上的预测误差进行对比,结果如表2所示。可以看出,VGG+FCN融合模型的ACC值达到0.835 9,RMSE为8.13,比其他模型的ACC值更高且RMSE值更低。这是因为本文VGG-FCN模型提取了空间区域的依赖特征,且未接入全连接层,模型训练时间较短、参数较少。

表2 5种模型在TaxiCD数据集上的实验结果Table 2 Experimental results of five models onTaxiCD dataset

将BP、RBF、CNN、SARIMA模型与本文VGG+FCN融合模型在BikeNYC1和BikeNYC2数据集上的预测结果进行对比,结果如表3所示。可以看出:在这两种数据集上,BP和RBF模型误差较大,说明人工神经网络很难拟合实际交通中出租车的动态情况;SARIMA模型作为经典的时间序列模型,能捕捉到周期性变化,但是由于其为线性,因此模型拟合效果较差;VGG+FCN融合模型所得ACC值和RMSE值更优,这是因为该模型获取车辆在城市空间流动的局部相关依赖关系(例如出租车在一个区域的订单数量可能与其周围区域订单数量正相关),采用VGG结构提取特征来增加网络深度,提高非线性变化以更好地拟合网络,同时利用反卷积重构图像减少模型参数,得到订单图像并利用CNN进行预测,最后接入全连接层得到与区域相等的一维向量。如果模型太复杂,则所需计算的资源较大且消耗时间较多,不能很好地支持计算开销,无法满足出租车订单预测的实效性要求。VGG+FCN融合模型训练时无全连接层,无需大量计算开销,因此支持在线实时预测。

表3 5种模型在BikeNYC1 and BikeNYC2数据集上的实验结果Table 3 Experimental results of five models onBikeNYC1 and BikeNYC2 datasets

图5为VGG-FCN融合模型的订单图像,该图像是模型对2014年8月1日至8月30日成都主城区出租车轨迹数据进行学习后,预测未来时间段订单所得,反映了实时预测的出租车订单情况。可以看出,一天内出租车订单数量是动态变化的,由于中心城区(图像中心处深色密集区域)人流量较大,因此订单数量较多。此外,个别地区订单量也较大,这是因为居民日常出行具有规律性和目的性。例如,在某一个栅格区域订单数很多,是因为该栅格区域有特定的或者较多的医院或学校。在城市交通中,出租车作为短时灵活的交通工具,由于其通常在0.5 h内都会将乘客送达目的地并开始继续寻客,因此图5中间隔0.5 h的时间划分较符合出租车实际行驶情况,如果将时间段划分过大,则不具有实际预测意义。

图5 VGG-FCN融合模型的订单图像Fig.5 Order image of VGG-FCN fusion model

4 结束语

本文提出一种VGG-FCN融合模型预测出租车订单数据。采用VGG提取不同区域出租车行驶特征,利用FCN上采样重构下一个时间段出租车订单图像,从而快速预测多个区域及不同时间段的出租车订单分布情况。此外,在保留VGG和FCN主要网络结构的同时去除全连接结构,减少模型参数量,加快网络训练速度。实验结果表明,与BP、RBF等预测模型相比,该融合模型预测结果平均准确率更高,适用于出租车订单预测以及采用图像输入与输出的回归预测。后续将结合天气、节假日、兴趣点等影响居民出行的因素进行研究,进一步提高订单预测准确率。

猜你喜欢
栅格出租车订单
春节期间“订单蔬菜”走俏
订单农业打开广阔市场
基于邻域栅格筛选的点云边缘点提取方法*
乘坐出租车
基于A*算法在蜂巢栅格地图中的路径规划研究
“最确切”的幸福观感——我们的致富订单
凭什么
开往春天的深夜出租车
李书福炮轰出租车
不同剖面形状的栅格壁对栅格翼气动特性的影响