基于谱聚类的高铁对沿线城市影响研究

2017-05-17 02:20邹小林秦书南
韶关学院学报 2017年3期
关键词:肇庆市场强高铁

邹小林,秦书南

基于谱聚类的高铁对沿线城市影响研究

邹小林,秦书南*

(肇庆学院数学与统计学院,广东肇庆526061)

贵广高铁和南广高铁开通后对沿线城市的影响,是决策者需要考虑的问题.将高铁沿线城市映射为带权无向图,将通达时间距离代替空间距离,采用引力模型来构造相似度函数,并建立相似度矩阵,最后采用谱聚类NCUT算法对高铁开通前后的沿线城市分别进行分类.结果显示:高铁大大提高了贵广高铁和南广高铁沿线城市(尤其是南宁市和贵港市)之间的场强;在肇庆市的县区中,四会市和肇庆高新开发区与肇庆其它城市的场强得到明显的提升.

高铁;谱聚类;引力模型;通达时间

国务院于2004年制定“中长期铁路网规划”以来,中国高铁建设高速发展,至2015年底,我国高铁营业里程超过1.9万km,占全球高铁里程的60%以上,已形成覆盖全国主要城市之间的高铁客运网.高铁缩短了城市之间、区域之间的时间距离,深深地影响了中国的社会发展,经济发展,尤其是对高铁沿线城市经济的影响.2016年7月,国家发展改革委、交通运输部、中国铁路总公司联合发布了《中长期铁路网规划》,勾画了新时期“八纵八横”高速铁路网的宏大蓝图.

近年来,高铁对经济的影响研究成为一个研究热点.文献[1]建立“可达性”模型研究高铁对沿线区域经济发展的促进作用.文献[2]采用区域活跃度模型分析某城市对周边区域产生的集聚吸引效应分析入手探讨高速铁路的影响.文献[3]采用区域经济和回归分析等建立高速铁路对区域经济影响的供给分析模型.文献[4]采用区域可达性等研究高铁的社会效应.

2014年12月26日,贵广高铁和南广高铁经建成通车,大大缩短了沿线城市之间的通行时间,那么高铁对沿线城市经济的影响到底怎样,是一个值得研究的问题.本文尝试采用谱聚类算法和引力模型来分析贵广高铁和南广高铁开通前后对沿线城市进行分类,根据开通前后分类结果的变化做出结论,为有关决策者提供参考.

1谱聚类算法NCUT

谱聚类算法的本质是将聚类问题转化为图的最优划分问题.如果每个数据点映射为图的一个顶点,数据点间的相似度映射为顶点间的边的权重,就可以构造了一个带权无向图G=(V,E),其中V是图的顶点集合,E是图的边的集合;这样就将聚类问题转化为划分图G问题.

NCUT算法[5]的目标函数为:

其中d(xi,xj)表示两个数据样本之间的距离,如取||xi-xj||2,σ为参数.

相似度矩阵的某一行的元素全部相加的和就是该行所对应的顶点的度,由相似度矩阵的全部度值为对角元素构成的对角矩阵就称为度矩阵,常用D表示.对称Laplacian矩阵定义为:

设X={x1,x2,…,xn}是待聚类的数据集,构造数据集X的相似度矩阵W的相似度函数通常定义为:

其中I为单位矩阵.

NCUT算法步骤:

步骤1:将样本集映射成一个带权无向图G,构造相似度矩阵W和度矩阵D,并根据公式(3)计算Lsym;

步骤2:计算矩阵Lsym的特征值及特征向量,选取前k个最大特征值所对应的特征向量ζ1,ζ2,…,ζk,构造矩阵M=[ζ1,ζ2,…,ζk]∈Rnxk,记M=[mij]nxk;

步骤4:将矩阵Y的每一行视为Rk空间中的点,然后采用K-means算法将其分为k类;

步骤5:将原样本点xi划分到聚类j中,当且仅当矩阵Y的第i行被划分到聚类j中.

2城市引力模型

1858年,卡利参照牛顿的万有引力定律提出城市引力模型[6]用来研究城市之间的经济影响力.城市引力模型公式表示为:I=Pi×Pj/d2,其中:I为互动量,Pi,Pj为两地的人口,d为两地之间距离.文献[7]将一定范围内的城市区域称为“城市场”,城市腹地称为城市影响力的“力场”,影响力的大小称为“场强”.“场强”的大小随着距离衰减而增大.场强计算公式为:

式中:Sik为城市i在k点上的场强;为城市的综合规模,P表示人口数,G表示生产总值;dik为i城市到k点的距离,本文采取高铁开通前后通行时间作为测度i和k城市间的时间距离替代空间距离;α为摩擦系数,其取值为1.a

3本文算法

3.1算法思路

首先,根据城市引力模型中变量收集相应的数据,即在贵广高铁和南广高铁沿线城市的统计局网站上收集各城市的GDP和人口数据.其次在12306网站、汽车客运站网站和百度导航上收集通达时间数据;其次,计算任何两个城市之间在高铁开通前后的通达时间,做为引力模型中的空间距离;再次,根据公式(4)分别计算高铁开通前后任意两个城市之间的场强,建立高铁开通前后基于场强的相似度矩阵,然后采用谱聚类NCUT算法分别对高铁开通前后的城市进行分类,根据开通前后城市分类的变化获得结论,即高铁的开通对哪些城市的影响更大.

3.2算法步骤

算法步骤如下:

步骤1:根据公式(5)计算高铁开通前后任意两个城市之间的通达时间T前和T后.其中Th表示乘坐高铁的时间,Tp表示乘坐普通火车的时间,Tb表示乘坐大巴或者汽车的时间.

步骤2:根据公式(4)的改进公式即公式(6)分别计算贵广高铁和南广高铁开通前后沿线城市中任意两个城市之间的场强,因此本文的相似度矩阵W=[sij]n,并计算其归一化相似度矩阵:

步骤3:根据公式(3)计算Isym.

步骤4:采用NCUT算法分别计算高铁开通前后的沿线城市的分类,根据分类结果给出结论.

4算法应用

4.1数据来源和数据预处理

通达时间的处理方式:如果乘坐高铁或普通火车能够直达的城市,就选取12306网站中的到达两个城市的最短时间作为建模的时间数据;如果大部分里程可以乘坐高铁和普通火车的城市,两个城市之间的通达时间由乘坐火车的时间加乘坐汽车的时间作为建模的时间数据;其他情况,就采用百度地图导航时间作为建模的时间数据.

比较近的两个区,在计算乘车时间时考虑市区内的乘车时间,如果两个城市较远,不考虑市区内的乘车时间.

4.2贵广高铁和南广高铁沿线城市的GDP和人口数

选取贵广高铁和南广高铁沿线主要城市作为本文研究对象,选取的城市如下:端州区、鼎湖区,高要市、四会市,高新区、广宁县、德庆县、封开县、怀集县,南宁市、贵港市、梧州市、云浮市、肇庆市、佛山市、广州市、贵阳市、桂林市和贺州市.端州区、鼎湖区和高要市作为一个整体参与讨论,记为肇庆市区.四会市与高新区作为另一个整体参与讨论,记为四会区.贵广高铁和南广高铁沿线城市在2014年的GDP和人口数分别如表1所示.

表1高铁沿线城市的GDP和人口数

4.3贵广高铁和南广高铁沿线城市的通行时间

在贵广高铁和南广高铁开通前后,分别计算任意两个沿线城市之间的通行时间如表2和表3所示.根据表2和表3的数据显示,通达时间减少最多的城市是贵阳,这说明贵广高铁的开通,大大减少了其他城市到贵阳的通行时间.

4.4计算贵广南广高铁开通前后沿线城市之间的场强

根据本文算法步骤2,分别计算选取沿线城市在高铁开通前后的城市引力值,计算结果如表4和表5所示.表4和表5的数据显示:高铁开通后,所有城市之间的场强都增大了,说明高铁的开通,增强了沿线城市之间的相互影响.

表2高铁沿线城市在高铁开通前的通行时间min

表3高铁沿线城市在高铁开通后的通行时间min

分别采用表4和表5的数据构造高铁开通前后沿线城市之间的相似度矩阵,并对相似度矩阵做归一化处理,根据本文算法步骤3计算相应的拉普拉斯矩阵Lsym.

4.5NCUT算法对贵广南广高铁开通前后沿线城市分类

用NCUT算法对选取沿线城市(高铁开通前)分成3类,分类结果是广州市分为一类,南宁市、贵港市和桂林3个城市分为一类,其它12城市分为一类.

用NCUT算法对选取沿线城市(高铁开通后)分成3类,分类结果是广州市分为一类,南宁市和贵港市两个城市分为一类,其它13个城市分为一类.

从分类的结果看,贵广高铁开通后,尽管16个城市(或区)之间的绝对城市场强都有很大提升,但城市之间的相对场强还是基本保持原有的格局,只有桂林市从原来与南宁市、贵港市所在类中分离出来,说明贵广高铁的开通对南宁市和贵港市的场强(与桂林市相比)提高较多,明显增强了南宁市和贵港市与其它城市之间的相互影响,而桂林的场强增长与其他12个城市差不多,这从另一个角度说明了桂林处于沿线城市的中间位置且以前的交通状况就比较良好.

表4高铁开通前沿线城市两两之间的场强

表5高铁开通后沿线城市两两之间的场强

4.6NCUT算法对贵广南广高铁开通前后对肇庆市县分类

本节讨论贵广南广高铁对肇庆市县的影响.在表2、表3、表4和表5中选取肇庆市区、四会区、广宁县、德庆县、封开县、怀集县相关的数据构成相应的表.根据4.5节的步骤进行处理.

用NCUT算法把高铁开通前的6个区域分成3类,分类结果是肇庆市区单独分为一类,德庆县和封开县分为一类,四会区、广宁县和怀集县分为一类.

用NCUT算法把高铁开通后的6个区域分成3类,分类结果是肇庆市区单独分为一类,四会区单独分为一类,其他4个县分为一类.结果表明:高铁开通后,对四会区的场强的提高,远远超过广宁县和怀集县的,这说明高铁对肇庆市县的影响中,四会区是最大的,这可以为肇庆市政府的决策提供一个参考.

5结语

本文采用谱聚类算法和引力模型分析高铁对沿线城市相互之间引力的影响.该方法将高铁沿线城市映射为带权无向图,采用引力模型来构造权函数,建立相似度矩阵,接着采用NCUT算法对沿线城市进行分类,分类结果显示:高铁大大提高了沿线城市之间的场强,尤其提高了南宁市和贵港市与其它城市的场强.在肇庆市内,四会市与肇庆高新开发区与其它城市之间的场强提高很多,即在肇庆市内,受高铁影响最大的是四会和高新开发区.

[1]王凤学.中国高速铁路对区域经济发展影响研究[D].长春:吉林大学,2012:3-6.

[2]李成,叶梓涵,郭宏伟.高速铁路对沿线经济发展影响——以京沪高速铁路为例[J].铁道经济研究,2016(6):21-25.

[3]张书明.高速铁路对沿线区域经济的影响分析与评估研究[D].天津:天津大学,2011:6-10.

[4]魏文刚.高速铁路对沿线区域社会效应分析-以郑西高铁为例[D].成都:西南交通大学,2013:5-8.

[5]SHI J,MALIK J.Normalized cuts and image segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000, 22(8):888-905.

[6]维基百科.城市引力模型[EB/OL].(2014-09-16)[2016-11-20].http://wiki.mbalib.com/wiki/城市引力模型.

[7]邓思远.武广高铁对衡阳市发展的影响研究[D].长沙:湖南师范大学,2014:30-38.

Study on the Impact of High Speed Railway on the Cities along the Railway Line Based on Spectral Clustering

ZOU Xiao-lin,QIN Shu-nan
(School of Mathematics and Statistics,Zhaoqing University,Zhaoqing 526061,Guangdong,China)

After the GuiGuang High-Speed Railway and NanGuang High-Speed Railway are put into use, policymakers need to consider the impact of those high-speed rails on the cities along the high-speed railway.In this paper,the cities along those high speed railways are mapped to the undirected weighted graph,with the distance of the arrival time being substituted for the spatial distance.The gravitational model is used to construct the similarity function,and the similarity matrix is established.Finally,NCUT algorithm is used to classify the cities along the high-speed railways before and after the operation of high-speed railways respectively.Results showed that the high-speed railway have greatly increased the field intensity between the cites(especially in Nanning and Guigang) along GuiGuang High-Speed Railway and NanGuang High-Speed Railway.In the counties of Zhaoqing city,the field strength between Sihui City,Zhaoqing hi-tech development zone and other counties are improved greatly.

high-speed rail;spectral clustering;gravity model;arriving time

O29

A%%%

1007-5348(2017)03-0009-06

(责任编辑:邵晓军)

2016-11-28

广东大学生科技创新培育专项资金项目(2016ZX023);肇庆市委政策研究室委托项目(2015223).

邹小林(l975-),男,湖南衡阳人,肇庆学院数学与统计学院副教授,博士;研究方向:模式识别.*通讯作者.

猜你喜欢
肇庆市场强高铁
广东省肇庆市高要区星科学校
广东省肇庆市怀集县幸福街道中心小学
广东省肇庆市封开县南丰镇中心小学
求解匀强电场场强的两种方法
场强与电势辨析及应用
基于K-means聚类的车-地无线通信场强研究
高铁会飞吗
LTE-R场强测试系统的实现
人地百米建高铁
肇庆市排舞运动的推广及其启示