公交出行时空模式的影响因素和效应研究

2023-12-12 12:31李睿智田朝军李晓伟
交通运输工程与信息学报 2023年4期
关键词:规律性高峰时段

陈 君,李睿智,田朝军,李晓伟

(西安建筑科技大学,土木工程学院,西安 710055)

0 引言

建设多模式、一体化的公共交通服务体系是解决大城市交通拥堵、环境污染等问题的重要途径。掌握公交乘客的出行特征和规律,并理解其影响因素和作用机理,是公共交通系统优化的基础[1-3]。20 世纪60 年代以来,国内外学者广泛探讨了建成环境、交通政策和个体属性等方面因素对于公交出行行为的影响[4-5]。但由于传统方法采用的调查数据存在时间跨度短等不足,难以对长期公交出行模式展开研究[6]。21世纪以来,国内外广泛利用智能公交数据对公交出行行为模式进行分析,如Hamed 等[7]应用布里斯班市4 天的公交卡数据,提取公交乘客的活动时间、地点和类型三个特征,来衡量公交乘客活动的相似性;Zhao 等[8]从连续2 年的伦敦市公交卡数据中挖掘具有代表性和可解释的公交乘客的活动分类。随着研究工作的不断深入,目前利用大数据对公交出行行为的分析已经从对公交出行模式的挖掘发展到对公交出行行为影响机理的探索[9]。

近年来,国内外利用智能公交(Advanced Public Transportation,APTS)、兴趣点(Point of Interest,POI)、气象等大数据,研究了建成环境、票价政策、公交服务、天气条件等因素对公交出行的影响。建成环境影响方面的成果较为丰富,赵丽元等[10]研究发现不同分区中公交站点层面的建成环境对公交出行率的影响程度和作用存在明显的差异性,而人口密度、公交投入是导致这类差异的重要因素;Gan 等[11]研究表明大多数建成环境变量与站间乘客量呈非线性关系,早高峰的出发地建成环境比目的地建成环境对站间乘客量的影响更大,而晚高峰和夜间则正好相反;Chen 等[12]研究了建成环境对多模式公交出行的非线性影响,发现大多数建成环境因素影响的有效范围和阈值在空间上存在差异。在票价的影响方面,Shin等[13]研究表明免票政策增加了老年人总的地铁出行次数,但对于老年人社交和娱乐出行没有显著影响。对于公交服务的影响,Papaioannou 等[14]发现公共交通具有良好的可达性和连通性,有助于乘客选择公共交通出行。在天气的影响方面,研究证实天气对于公交出行具有显著影响,温度和降雨量的变化会导致公交出行量发生显著变化[15];强降雨对公交客流的影响存在时空不平衡,在高峰时段上下行方向和断面客流的不平衡明显加剧[16]。目前,利用大数据对公交出行行为影响的研究主要集中在对公交站点、线路客流量的影响分析方面。

综上,传统调查数据对于公交出行行为的研究存在制约性,十余年来,国内外学者广泛应用大数据对公交出行模式进行分析和挖掘。随着数据源的日益丰富,近年来研究人员开始探索公交出行的影响因素和作用效应,但现有成果主要集中在对公交客流量的影响分析方面,而对公交出行时空模式影响的研究还很少。理解公交乘客出行时空模式的影响机理,能够为公交导向的城市规划、“公交优先”政策制定以及精细化的公交系统优化等方面提供重要依据。本文集成多源数据,通过分析APTS 数据获取公交出行的时空特征,应用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法挖掘公交出行的时空规律性,以公交出行的起点建成环境、终点建成环境、出行路径性能、公交运营性能和公交出行强度5方面指标为自变量,以公交出行时空特征和公交出行时空规律性2方面指标为因变量,构建结构方程模型(Structural Equation Modeling,SEM)对公交出行时空模式的影响因素和作用效应进行建模和分析。

1 研究框架

本文融合多源数据对公交出行时空特征和时空规律性的影响进行研究,主要步骤如下:

(1)多源数据采集和集成:本文共收集陕西省渭南市APTS、POI 和城市路网等数据,其中APTS数据来自渭南市公共交通总公司,包括该市2018年11 月12 日—30 日连续3 个星期共15 个工作日主城区19 条公交线路的公交卡数据、公交GPS 数据、公交站点坐标数据和公交调度数据。同时利用高德地图API 接口,采集渭南市公交站点500 m范围内的POI信息,主城区电子地图数据来自该市资源与规划局。截至2018 年,渭南市主城区常住人口约为50万。

(2)个体公交出行OD 构建:公交乘客上车站点通过将公交卡、公交GPS、公交站点坐标等数据关联得到,下车站点采用出行链方法推算得到[17],换乘行为基于独立阈值模型进行判断[18]。将个体乘客同一出行目的不同出行阶段合并,得到15 个工作日248 197条公交出行OD。

(3)公交出行时空模式分析:根据公交出行OD 数据,统计个体乘客公交出行距离、出行时长等时空特征,在此基础上计算公交出行的时间和空间规律性。本文公交出行时间和空间规律性分别采用公交出行时间规律指数和空间规律指数来表征,公交出行时间规律指数是指个体乘客在某个时段公交出行的密集程度,空间规律指数是指个体乘客在某个OD的公交出行密集程度。

(4)公交出行时空模式影响模型建立:以单次公交出行OD 为分析单元,建立变量指标体系,构建SEM 理论模型,计算变量指标数据,选取样本数据,检验样本数据的效度,建立早高峰、平峰和晚高峰多群组SEM模型,对模型的适配度进行检验。

(5)公交出行时空行为模式影响效应分析:根据构建的SEM 模型,分析各变量对公交出行时空特征和时空规律性的影响效应。

本文的研究框架如图1所示。

图1 公交出行时空模式影响建模和分析框架Fig.1 Modeling and analysis framework of influencing on bus travel spatio-temporal patterns

2 公交出行时间和空间规律指数计算

DBSCAN 是一种基于密度的聚类算法,能够把具有足够高密度的时段(区域)划分为簇,并可在有噪声的数据库中发现任意形状的聚类,研究表明该算法能有效识别个体乘客出行密集的时段(区域)[19]。本文应用DBSCAN 算法挖掘个体公交乘客密集出行的时段(OD),在此基础上计算公交出行的时间(空间)规律指数。

2.1 时间规律指数计算

本文公交出行时间规律指数为个体乘客各规律出行时段的出行量占总出行量的比例,计算公式见下式:

式中:TRij为乘客i在规律出行时段j的出行时间规律指数;ΡTij为乘客i在规律出行时段j的出行次数;ΡTi为乘客i的总出行次数。

应用DBSCAN算法识别个体乘客的规律出行时间,参数ε代表乘客两次规律出行的最大时间间隔,参数M代表规律出行时段的最小出行次数。参考Kieu 等[19]的研究,通过灵敏度分析完成DBSCAN 算法参数选取,ε取值为5 min,M取值为6。若乘客在15 天内的某时间段及相邻的5 min 以内的出发次数≥6次时,将这些时间点划分为簇(规律出行时间),不足6 次的出行时间标记为噪声(noise)。

以个体乘客“per 00000***”为例,规律出行时间的识别结果示例见表1。

表1 规律出行时间识别结果示例Tab.1 Example of identification results for regular travel time

以乘客“per 00000***”为例,TRij计算结果示例见表2,不同TRij的出行时间分布如图2 所示(以2018年11月12日为例)。

表2 TRij计算结果示例Tab.2 Example of calculation results for TRij

图2 不同TRij的出行时间分布Fig.2 Travel time distribution of different TRij

由图2 可知,TRij高的出行主要发生在高峰时段,其中,TRij最高(0.8~1)的出行呈现出明显的早、中、晚3 个高峰的特征;TRij中等(0.2~0.8)的出行呈现出明显的早、晚2 个高峰的特征;TRij最低(0~0.2)的出行在平峰时段的分布比例较高。

2.2 空间规律指数计算

本文公交出行空间规律指数为个体乘客各规律出行OD 的出行次数占该乘客总出行量的比例,计算公式见下式:

式中:SRik为乘客i在规律出行OD 对k的空间规律指数;ΡTik为乘客i在规律出行OD 对k的出行次数;ΡTi为乘客i的总出行次数。

应用DBSCAN 算法挖掘个体乘客规律出行OD,参数ε代表同类规律出行站点的最大空间直线距离,参数M代表规律出行OD 的最小出行次数。参考Kieu 等[19]的研究,通过灵敏度分析完成参数选取,ε取值为1 km,M取值为8。若乘客在15天内从某站点及1 km以内邻近站点的出发(到达)次数≥8次时,将这些站点划分为簇,该类站点即为规律出行起点(终点)站,不足8次的站点标记为噪声(noise)。若个体乘客一次出行的起点和终点均为规律站点,则将该乘客此次的出行OD 判断为规律出行OD。

以个体乘客“per 00000***”为例,规律出行OD的识别结果示例见表3。

表3 规律出行OD识别结果示例Tab.3 Example of regular travel OD identification results

以乘客“per 00000***”为例,SRik计算结果示例见表4,不同SRik的公交出行OD分布如图3所示(以2018年11月12日为例)。

表4 SRik计算结果示例Tab.4 Example of calculation results for spatial regularity

图3 不同SRik的OD分布Fig.3 Travel OD distribution of different SRik

由图3 可知SRik的出行高度集中在城市中心区域,见图3(a),随着SRik的降低,公交出行OD分布逐渐扩散,见图3(b)(c)(d)(e),公交出行的SRik与城市土地利用模式显示出一定的关联性。

3 公交出行时空模式影响模型建立

3.1 SEM模型原理

SEM 模型综合了方差分析、回归分析、路径分析和因子分析,是一种建立、估计和检验因果关系模型的方法,可拟合大量内生及外生变量间的复杂相关性,并将多个变量用几个潜变量来表示,可获得自变量对因变量影响的直接效果、间接效果、总效果。本文应用SEM 模型,对个体公交出行时空模式的影响进行建模和分析。

结构方程模型包括2个次模型:测量模型和结构模型。测量模型描述潜在变量如何由相应的显性指标所测量;结构模型描述潜在变量间的关系及模型中其他变量无法解释的变异部分[20]。

测量模型的表达式见式(3)和(4):

式中:x和y为可直接观测的观察变量;Λx为x在ξ上的因子负荷矩阵,Λy为y在η上的因子负荷矩阵;ξ和η是不可直接观测的潜变量,其中ξ为外生潜变量,η为内生潜变量;δ和ε是观察变量x和y对应的测量误差。

结构模型的表达式见下式:

式中:B为反映内生潜变量之间相互关系的系数矩阵;Γ为反映外生潜变量与内生潜变量间关系的系数矩阵;ζ为结构方程模型残差项。

3.2 影响变量指标

本文所研究的公交出行时空模式包括公交出行时空特征和公交出行时空规律性两个方面,其中公交出行时空特征采用出行距离和出行时长2个变量来衡量,公交出行时空规律性采用TRij和SRik2 个变量来衡量。参考已有研究,并考虑研究数据的可得性,将公交出行时空模式的影响因素分为起点建成环境、终点建成环境、出行路径性能、公交运营性能和公交出行强度5个潜变量。

(1)起点建成环境和终点建成环境

大量的研究表明城市建成环境的空间差异是居民出行生成的本质,这一关系也在城市规划领域被多次证实。建成环境是相对于自然环境而言的一种人造环境,包括从都市的土地利用模式到都市的交通系统再到私人建筑及其周围空间的一切[5]。谭一洺等[21]研究表明建成环境的地理背景应综合考虑乘客出行起点和出行终点。本文中出行起点建成环境和出行终点建成环境以公交站点500 m 缓冲区内“3D”指标(设计、密度、多样性)来表征,以道路密度衡量“设计”特征,通过ArcGIS缓冲区分析获取公交站点500 m 范围内的道路长度,进而计算道路密度;以科教POI 密度、办公POI 密度和生活服务POI密度综合衡量“密度”特征;以土地利用混合度衡量“多样性”特征。土地利用混合度计算见下式:

式中:Hs为公交站点s附近的土地利用混合度;Ρp为第p类POI 的比例;m为该缓冲区POI 类型的数量。

(2)出行路径性能

研究表明良好的公交线路规划及道路条件有助于乘客选择公交出行[14],本文以公交线路途经的道路状况、延误、绕行程度来表征出行路径性能,用途经快速路及主干路占比衡量道路状况;用途经交叉口平均间距衡量延误;用出行直线距离与行程距离之比衡量绕行程度。

(3)公交运营性能

公交系统的运营性能对乘客出行行为具有影响[14],本文用公交线路的运营时长、发车频率、行程时间可靠性系数衡量公交运营性能,其中行程时间可靠性系数的计算见下式:

式中:Tl为公交线路l的行程时间可靠性系数;σlg为公交线路l的第g对OD 的行程时间标准差;n为公交线路l的OD数量。

(4)公交出行强度

Beirão 等[22]将个体属性与交通方式进行关联分析,研究表明个体属性是影响居民出行的主要因素之一。此外,Cao 等[23]研究表明若不考虑居民的自我选择机制,则会过大估计建成环境的影响。由于本研究数据无法获得个体乘客的社会经济属性,故本文使用公交出行强度来表征个体乘客的异质性,以15 个工作日的出行天数和出行次数来衡量。

3.3 研究假设

在已有研究的基础上,提出本文建立公交出行时空模式影响模型的研究假设:

H1:起点建成环境通过作用于出行路径性能对公交出行时空特征具有间接影响。

H2:起点建成环境通过作用于公交运营性能对公交出行时空特征具有间接影响。

H3:终点建成环境通过作用于出行路径性能对公交出行时空特征具有间接影响。

H4:终点建成环境通过作用于公交运营性能对公交出行时空特征具有间接影响。

H5:公交运营性能对公交出行时空特征具有直接影响。

H6:出行路径性能对公交出行时空特征具有直接影响。

H7:公交出行强度对公交出行时空规律性具有直接影响。

H8:公交出行强度与公交运营性能高度相关。

H9:公交出行时空特征对公交出行时空规律性具有直接影响。

H10:公交运营性能与出行路径性能高度相关。

基于以上假设,构建公交出行时空模式影响理论模型,结构如图4所示。

图4 理论模型结构Fig.4 Structure of the theoretical model

3.4 样本选取和效度检验

建立结构方程模型,样本量与观察变量数的比例至少为10∶1 至15∶1 间,本文22 个观察变量,则至少需要样本220~330 个。SEM 建模一般样本量越大越好,但在SEM 适配度检验中,若使用样本较多,绝对适配度指数χ2易达到显著性水平(p<0.05),使得假设模型与实际数据出现不契合,因此需要确定合适的样本量。本文随机抽取实验样本量为300、500、700、900、1 000、1 100、1 300、1 500时假设模型的拟合度,结果表明900 为模型满足χ2配适标准的最大样本量。

为分析不同时段公交出行时空行为影响的差异性,本文从15个工作日的早高峰(7:00~9:00)、晚高峰(17:00~19:00)、平峰时段(14:00~16:00)分别随机抽取900 个样本建立多群组模型。利用SPSS 25.0 通过KMO 和Bartlett 检验对样本数据进行了因子模型适应性分析,KMO 值均大于等于0.5,Sig.均小于0.05,表明观察变量均可用于模型假设检验。样本数据的描述性统计见表5。

表5 样本数据描述性统计Tab.5 Descriptive statistics of sample data

由表5可知,公交出行距离和出行时长在平峰时段均长于早、晚高峰时段,表明平峰时段公交出行范围更大;公交出行的时间和空间规律指数在平峰时段均远低于早、晚高峰时段,表明平峰时段公交出行在时空上随机性更强。

3.5 模型适配度检验

本文采用广义最小二乘法(GLS)对参数进行估计,应用AMOS 20.0 软件对假设模型进行检验。经检验,模型拟合指标均满足适配标准,拟合指标见表6。

表6 模型拟合指标Tab.6 Model fitting indices

3.6 变量间的影响效应

变量之间的影响效应可解析为直接效应、间接效应和总体效应。直接效应是自变量对因变量的直接影响,间接效应是自变量通过影响其他中介变量对因变量产生的间接影响,总体效应则是直接效应与间接效应之和。本文早高峰(7:00~9:00)、平峰(14:00~16:00)、晚高峰(17:00~19:00)的模型估计结果如图5所示,变量间的影响效应见表7。

表7 变量之间的影响效应Tab.7 Effects between variables

图5 模型估计结果Fig.5 Modeling results

根据表7绘制公交出行时空模式的影响机制,如图6所示。

图6 公交出行时空模式的影响机制Fig.6 Influencing mechanism of spatio-temporal patterns of bus travel

4 公交出行时空模式影响效应分析

4.1 出行起点(终点)建成环境的影响

出行起点(终点)建成环境通过影响出行路径性能和公交运营性能,从而对公交出行时空特征产生显著的间接影响(见图5),早高峰、平峰、晚高峰时段影响效应分别为-0.244、-0.354、-0.156(-0.228、-0.293、-0.111)(见表7)。表明具有高密度、高混合度用地和高密度路网的建成环境有利于提升公交的出行路径性能和运营性能,从而间接减少了公交出行距离和出行时长。

起点(终点)建成环境通过影响公交出行时空特征,进一步对公交出行时空规律性产生显著正向影响(见图5),早高峰、平峰、晚高峰时段的影响效应分别为0.022、0.064、0.021(0.021、0.053、0.019)(见表7),说明高密度、高混合度用地和高密度路网的建成环境有利于公交乘客保持出行的时空规律,其内在原因可能是建成环境条件越好,公交系统越发达,公交出行则更便捷,从而公交出行的时空规律性更强。

总体上,起点建成环境对公交出行时空特征和规律性的影响高于终点建成环境,平峰时段的影响高于早、晚高峰时段,建成环境对于公交出行时空模式的影响具有时空异质性。

4.2 出行路径性能的影响

出行路径性能对公交出行时空特征具有显著的直接影响(见图5),早高峰、平峰、晚高峰时段的效应分别为-0.749、-0.835、-0.420,平峰时段影响最大,早高峰次之,晚高峰最小(见表7)。表明通过优化公交线路运行的道路条件、降低非直线系数等措施改善出行路径性能,能有效减少公交出行距离和出行时长,从而提高公交出行的效率。

出行路径性能通过直接影响公交出行时空特征,对出行时空规律性产生显著的间接影响(见图5),早、晚高峰时段的影响为正向效应(0.069、0.087),而在平峰时段的影响为负向效应(-0.151)(见表7)。其原因可能是早、晚高峰时段出行路径性能的改善,吸引了更多的公交通勤出行,从而提升了公交出行的时空规律性;平峰时段改善出行路径性能,吸引了更多的非通勤出行,反而降低了公交出行的时空规律性。

4.3 公交运营性能的影响

公交运营性能直接对公交出行时空特征产生显著的负向影响(见图5),早高峰、平峰、晚高峰时段的影响效应分别为-0.413、-0.472、-0.407(见表7),平峰时段的影响略高于早、晚高峰时段。表明通过增加公交运营时间、提高发车频率、提升公交出行行程时间可靠性等措施改善公交运营服务水平,能有效减少公交出行距离和出行时长,从而提高公交出行的效率。

公交运营性能对公交出行的时空规律性不具有显著影响,其原因可能是本文选取的测量变量仅部分体现了公交运营的异质性,此外其他外生变量对出行时空规律性的影响远大于公交运营性能,导致公交运营性能的影响不显著。

4.4 公交出行强度的影响

公交出行强度对公交出行时空规律性具有显著的直接影响(见图5),早高峰、平峰、晚高峰时段的影响效应分别为0.688、0.764、0.682(见表7),说明公交出行频率越高,公交出行的时空规律性越强。

公交出行强度对公交出行的时空特征不具有显著影响,可能是由于其他外生变量的影响远远大于公交出行强度的影响所导致。

4.5 公交出行时空特征的影响

公交出行时空特征对公交出行时空规律性具有显著的直接影响(见图5),早高峰、平峰、晚高峰时段的影响效应分别为-0.092、-0.180、-0.090(见表7),平峰时段影响最大,早高峰次之,晚高峰最小,说明公交乘客的出行距离和出行时长越短,其公交出行的时空规律性越强。

5 结论

本文集成智能公交数据获取公交出行时空特征,应用DBSCAN 聚类算法计算公交出行的时间和空间规律性,融合多源数据构建变量指标体系,建立结构方程模型对公交出行时空特征和时空规律性的影响效应进行分析。研究结果表明:

(1)公交出行时空模式具有时空异质性,平峰时段公交出行距离和出行时长均长于早、晚高峰时段;时间规律性强的公交出行主要发生在高峰时段,提示在高峰时段应更加重视公交服务的时间可靠性;空间规律性强的公交出行集中分布在城市中心区,提示在城市中心区应主要通过固定线路公交来保障出行需求,而在城市郊区则可以更多地采用定制公交来保障出行需求。

(2)各因素对公交出行时空模式的影响具有时间异质性,平峰时段各因素对公交出行时空特征和时空规律性的影响均大于早、晚高峰时段,因而公交优化措施应考虑平峰和高峰时段的差异性。

(3)出行路径性能、公交运营性能、起点建成环境和终点建成环境从大到小依次对公交出行时空特征有显著影响。该结论提示可以通过改善出行路径条件、公交服务水平和公交站点周边的建成环境来减少公交出行的距离和时间,从而提升城市公交出行的效率。

(4)起点建成环境和终点建成环境对公交出行时空规律性有显著的正向影响。该结论表明能够通过优化公交站点周边的建成环境来提升公交出行的时空规律性,从而有利于公交机构预测公交出行需求,提升公交运营效率,降低公交运行成本。

(5)随着数据源的丰富,可以进一步完善公交出行的影响因素,以便能够更加全面地理解公交出行时空模式的影响效应。未来研究还可以将大数据与传统数据进行融合来获取个体乘客的社会经济属性,从而能更加准确地理解个体属性对出行时空模式的影响。

猜你喜欢
规律性高峰时段
What Is the Hidden Card?
病毒病将迎“小高峰”全方位布控巧应对
石庆云
四个养生黄金时段,你抓住了吗
公证改革发展若干规律性认识
雨天早高峰,自在从容时。
傍晚是交通事故高发时段
分时段预约在PICC门诊维护中的应用与探讨
分时段预约挂号的实现与应用
趣味填字