基于百度API开源数据的居民出行研究

2018-09-14 08:47张志敏沈俊峻
交通运输研究 2018年3期
关键词:小汽车青岛市路线

王 振,张志敏,王 伟,高 歌,沈俊峻

(1.青岛市城市规划设计研究院,山东 青岛 266071;2.中国海洋大学经济学院,山东 青岛 266100;3.山东科技大学交通学院,山东 青岛 266590;4.青岛董家口经济区管理委员会,山东 青岛 266400)

0 引言

截至2017年末,我国的城镇化率已升至58.52%。伴随着城市化进程的不断加快,城市的界限不断被突破,城市的空间不断得到扩张,由此带来了居民出行的多样性。尤其是在城市群、都市圈、中心区范围内,通勤性出行和生活性出行呈现各自不同的特点,因此有必要开展居民出行调查,以支撑城市的理性发展。

居民出行调查是城市总体规划、城市综合交通规划的基础,主要包括出行次数、外出目的、交通方式结构、出行距离以及时耗等[1]。国外的居民出行调查的主要方法为电话访问(Computer-Assisted Telephone Interviewing,简称CATI),但是出行漏报率较高,在20%~25%之间[2]。美国、瑞士等国多次进行基于GPS的居民出行调查测试,解决了传统居民出行调查漏报率较高的弊端[3]。国内赵晖等基于万份问卷调查数据,构建了以通勤时间和距离为基础的职住分离度量模型[4]。刘志林等基于问卷调查的基础数据、北京市第5次人口普查及第1次经济普查数据,讨论了职住空间错位和居民通勤时间之间的关系[5]。孟斌以北京市主城区为研究对象,通过11 000份调查问卷分析居民的通勤时间,得出北京职住分离现象严重的结论[6]。目前,居民出行调查以问卷调查为主,调查工作量大,抽样率一般为2%~5%[5]甚至更低,并且调查成本较高,因此有必要借助新技术提高居民出行调查的便捷性和可操作性。综上,国内外的居民出行调查在出行漏报率、样本抽样率等方面仍然存在不足,由此基于互联网发展起来的网络调查问卷具有覆盖范围广、填报时间相对自由等优势,在一定程度上是对传统居民出行调查的有效补充。

北京、上海等国内城市已经率先采用网络问卷和电子终端结合的方式进行居民出行调查,网络问卷能够通过地图定位动态记录居民的坐标位置,避免了后期数据录入工作,但仍然需要借助移动设备入户调查。刘鹏程等通过百度地图应用程序编程接口 (Application Programming Interface,简称 API),对调查所得的居住地和就业地进行路径匹配,进而得到不同交通方式下的通勤距离,为分析居民的职住通勤特征提供了量化依据[8]。龙瀛等借助公交IC卡识别居民的通勤出行行为,分析居民的出行特征,并与居民出行调查数据进行对比,得出两者较吻合的结论[9]。李艳红等借助出租车起讫点数据,构建了基于出租车出行的居民时空分布指标体系和分析方法[10]。王开泳等提出了基于微博数据判别城市空间联系度的方法,弥补了城际通勤数据困乏的现状[11]。

国内学者通过公交IC卡数据、出租车数据、微博数据等多源数据对出行链进行了广泛的研究,尤其是多源数据之间的相互融合、相互校正能够大幅提高城市调查和规划管理的效率和水平,但在传统调查与新兴技术的结合上仍然处于探索阶段。鉴于此,本文通过设计网络调查问卷,借助百度地图等国内先进的互联网数据平台在线分析数据,实现线上线下有机融合,以弥补传统居民入户调查中出行时间、出行距离难以估计的弊端。

1 居民出行链数据的提取方法

本文借助百度API接口,通过对网络调查获得的居民出行起讫点(Origin-Destination,简称OD)规划完整的出行链,并与青岛市第3次交通出行调查(2016)结果进行对比校正,以弥补传统入户调查对出行时间和距离预估不准、完整出行链难以获取的不足。

1.1 出行起讫点获取

最早的居民出行调查起源于美国,至今已有60多年的历史。美国1944年颁布《联邦资助公路法案》,但缺乏对居民出行信息调查的相关条款,由此提出了居民出行起讫点调查方法[12]。青岛市分别于2002年、2011年进行了2次交通出行大调查,并于2016年由青岛市地铁集团组织了第3次交通出行调查。

青岛市第3次交通出行调查(2016)以青岛市内6区(市南区、市北区、李沧区、崂山区、黄岛区、城阳区)为核心,兼顾外围胶州、即墨、平度、莱西,以网络调查为主,人工调查为辅。

网络问卷调查分为全体居民出行调查和就学家庭出行调查,以前者为主体、后者为补充调查。全体居民出行调查主要针对在青岛居住的人口,调查日出行信息;就学家庭出行调查则是以青岛市中心城区内所有中小学为调查范围,调查学生及其家庭成员一天的出行信息。

本文以2016年青岛市第3次交通出行调查数据为对象,通过设计网络问卷(见图1),共收集92 916万条出行数据,其中基于公交的有效出行数据为21 205条,基于小汽车的有效出行数据为27 809条。而济南于2009年组织了第3次居民出行调查,通过传统问卷调查获得了38 328条出行数据[11],由此可见新技术能够显著提高数据获取的能力。

图1 居民出行网络调查问卷

调查以家庭为单位,通过网络填写问卷,主要采集居民的家庭特征(年龄、性别、职业等)和出行特征(出行起点及终点、交通方式、换乘比例、出行目的等)(见表1)。

表1 居民出行调查数据示例

1.2 出行路线规划

通过网络交通出行调查得到的原始数据,仅能反映出行的起讫点、出行时间、出行方式等主要信息,具体出行距离是无所获取的。将调查的样本数据按公交和小汽车两种方式筛选后,通过百度地图地址匹配接口获取出行起讫点位置坐标,依据坐标信息和百度地图API,推算居民出行时耗、出行距离等出行信息,从而解决了传统调查方法无法获取出行距离和对出行耗时预估不准的问题,技术路线如图2所示。

图2 出行路线规划的技术路线

2 交通出行数据挖掘

2.1 居民出行分析

(1)公交出行

一次完整的公交出行(见图3)需由出发点O步行至公交站,在公交站等候上车后,经由中间站换乘(可以不换乘),到达公交下客站,最后步行至目的地D。期间将会产生出发点O至上客站的步行时间、上客站至换乘站的公交运行时间、换乘站间的步行时间、换乘站至下客站的公交运行时间以及下客站至目的地D的步行时间等数据。

图3 公交出行路线

(2)小汽车出行

一次完整的小汽车出行(见图4)相对简单,即由出发点O驾乘私家车或者乘坐出租车到达目的地D,是一种“门到门”运输,期间将会产生车辆运行时间数据。

图4 小汽车出行路线

2.2 百度地图API

百度地图Web服务API为开发者提供了基于百度地图应用的程序接口,即通过http/https形式发起检索请求,获取指定格式的检索数据。为了研究城市居民公交出行和小汽车出行的出行特征,主要采用百度地图Direction API v2.0服务。该服务能够根据起点和终点检索符合条件的公共交通方案或小汽车行驶路线规划方案。公交出行路线规划方案见表2,针对同一OD对,共规划5条不同路线及相应不同阶段的出行时间和距离。同理,小汽车出行路线规划方案见表3。

表2 百度地图公交出行API调用数据示例

表3 百度地图小汽车出行API调用数据示例

2.3 数据融合分析

基于百度地图API和居民网络出行调查得到的起终点坐标,得到同一个OD下的不同出行路线,如表2所示;然后根据时间最少、距离最短原则,按照式(1)和式(2)确定最佳路径(示例见表4),并与居民出行网上问卷数据相互比对校验。

式(1)~(2)中:Dij,Tij分别为起讫点i和j之间第k条路线的最短距离(m)和最小耗时(s);dij(k)tij(k)分别为起讫点i和j之间第k条路线的出行距离(m)和时间(s)。

表4 不同OD最优路线规划方案示例

3 不同出行方式出行特征分析

居民的出行方式是刻画城市居民出行结构、了解居民出行特点的重要方面,一般可分为公交、小汽车、步行、自行车、单位班车及其他。出行方式结构与各种交通方式的特性、服务水平、城市空间结构以及交通管理措施等相关,与城市规模的相关性不是很明显[14]。公交和小汽车是居民常用的两种出行方式,通过百度API路线规划计算得出的平均出行距离及出行时间等总体指标与青岛市第3次交通出行调查(2016)中通过公交IC卡计算的结果基本一致,但在具体的分布上有所差异。

公交出行总体平均出行距离为5.83km,而青岛市第3次交通出行调查(2016)中该项数据为5.7km(不含步行的公交运距),小汽车出行的平均出行距离为9.97km,小汽车出行的平均出行距离接近公交车出行的2倍。从具体分布上来看(见图5),小汽车的出行距离分布相对分散,即小汽车出行的适应性相对较高,出行距离的覆盖半径较大;公交车的出行距离分布相对集中,6km以下占比高达50.28%。与此同时,小汽车在6km以下的出行占比同样高达52.22%。由此可看出,6km以下的距离范围内,公交和小汽车在对居民出行的吸引上是存在竞争关系的,应该提倡居民6km以内短距离出行选择公共交通工具,以合理优化出行结构。

图5 不同出行方式平均出行距离

公交车出行的平均时耗为45.2min,而青岛市第3次交通出行调查(2016)中该项数据为48.9min,小汽车出行的平均出行时间为18.14min,具体分布见图6。公交车出行的平均出行时间是小汽车出行的2.5倍,尚不能满足深圳公交提速“1.5”战略提出的“乘坐公交加步行的时间要控制在开私家车时间的1.5倍之内”。

图6 不同出行方式平均出行时间

4 不同出行目的出行特征分析

根据城市居民出行的特性,本次调查将出行目的分成11类:上班、上学、购物餐饮、单位业务、个人事务、接送孩子、到达/离开青岛、就医、回家、娱乐及其他[15]。不同出行目的平均出行时间如图7所示。

图7 不同出行目的平均出行时间

在公交出行中,除回家外,上班、个人事务和购物出行是城市居民的主要出行活动,其平均出行时间分别为54min,56.6min及45.4min。其中,单位业务的平均出行时间最长,为57.7min;上学的平均出行时间最短,为40.6min。在小汽车出行中,单位业务的平均出行时间最长,为23.94min;其次为娱乐的平均出行时间,为23.16min;上学的平均出行时间最短,为10.89min。

不同出行目的平均出行距离如图8所示。在一次公交出行中,单位业务的平均出行距离最长,为10.5km;其次是个人事务的平均出行距离,为10km;接送孩子和上学的平均出行距离最短,为6km左右。在一次小汽车出行中,娱乐的平均出行距离最长,为18.84km;其次是单位业务的平均出行距离,为15.15km;接送孩子和上学的平均出行距离最短,为5.5km左右。

图8 不同出行目的平均出行距离

通过分析可以得出,就平均出行距离而言,非常发性的事务类出行,如单位业务、个人事务,无论公交还是小汽车均大于通勤类出行,如上班、就学。在各种出行目的下,公交车的平均出行时间均显著高于小汽车。

5 结论

在传统的出行调查中,居民出行特征(包括出行时间和出行距离)往往来源于被调查者的主观感知,难以有效地反映真实的出行状况;同时一条完整的出行链包含两端步行时间、在车时间、换乘时间等,但调查数据仅能大致地反映总出行时耗,难以分阶段统计。并且传统的居民出行调查往往以入户问卷调查为主,需要投入大量的人力、物力和财力,且受调查成本所限,样本抽样率较低。随着互联网和大数据技术的发展,通过网络问卷收集居民的出行信息成为可能,同时居民出行信息实时的入库和地址编码也大幅缩短了调查的时间周期。

结合青岛市第3次交通出行调查(2016),本文基于地图设计网络调查问卷,获取居民出行起讫点坐标,并通过百度地图API路线推测得到一次出行的完整出行链,从而有效解决了传统调查中无法准确得到出行时间和出行距离的弊端,尤其是步行时间和步行距离。无论是调查前期的数据收集还是后期的数据分析,本文提供的技术方法都能够显著缩短出行调查周期,且具有采集数据样本量大、成本低、精度高的特点,在城市居民出行调查中有着广泛的应用前景,但同时也存在样本分布不均、互联网低频用户采样不足的问题,需要在下一步的入户补充调查中解决。

猜你喜欢
小汽车青岛市路线
小汽车
最优路线
我的玩具小汽车
『原路返回』找路线
拼一拼
2019青岛市科创板发展现状
关于青岛市地下城市空间开发的思考
青岛市市立醫院(集团)
找路线
青岛市关工委采取多种形式学习党的十八届三中全会精神