基于过闸数据的江苏省内河货运情况分析

2023-06-24 08:47陈奕超陈冬刘春启
水运管理 2023年3期
关键词:内河航运数据分析江苏省

陈奕超 陈冬 刘春启

【摘 要】 为提高江苏省内河水运行业的科学管理水平,基于对江苏省交通运输船闸联网收费数据的分析,对全省航闸运行、货物运输情况进行研究。提出针对数据预处理、总体情况分析、船闸运行分析、货物运输分析等4部分的算法设计,并采用2021年全年过闸数据对全省内河航运发展进行实证分析,这对于全面提升江苏省港航行业规划建设、运行管理及综合服务水平具有重要意义。

【关键词】 江苏省;内河航运;过闸数据;数据分析

0 引 言

江苏省是内河航运大省,全省内河航道网络密布,航道总长约2.4万km。内河航运是江苏省经济发展的重要支柱,内河货运量约占全省综合货运量的1/3。隨着我国经济由高速增长阶段进入高质量发展阶段,尤其是在推动江苏高质量发展走在全国前列的目标指引下,江苏省内河航运发展面临的形势和任务都发生了重大变化。《交通强国建设纲要》《智能航运发展指导意见》等国家、省部委颁布的文件对内河航运发展指明了方向。本文通过对江苏省交通运输船闸联网收费数据开展航运大数据分析,对全省航道运行、货物运输情况进行了实证研究。

1 江苏省航闸基础设施现状

江苏省内河航道网络密布,截至2021年底,江苏省内河航道里程达24 648 km,航道网密度23.0 km/100 km2,两者均居全国第一位。Ⅳ级以上内河高等级航道里程3 197 km,通达80%的县级城市;省干线达标航道里程达2 363 km,可通行1 000吨级船舶的航道覆盖全省78%的县级及以上航道节点和50%的省级及以上开发区。

江苏省内河航道共有通航船闸111座,其中交通部门管理的船闸有52座,施桥、邵伯等10座位于京杭运河沿线的船闸由苏北航务管理处管理,其余船闸由相应的市航道处或港航中心管理。

2 过闸数据简介

船舶过闸数据来源于江苏省交通运输船闸联网收费数据库,以2020年的船舶过闸数据为例,信息数据共计305万条,主要包括船舶名称、上下行标志、船闸名称、报到时间、船籍港名称、船舶类型、船舶参数(总长、总宽、总吨、载重吨、型深)、空载标志、货物名称、航次起点、航次终点、实际载货等数据信息。

船舶过闸的数据覆盖面广、统计周期长,除部分苏南航道外,基本涵盖所有在江苏省内航行的内河船舶。

3 算法研究

为更好地从过闸数据中提取有效信息,实现内河水运信息化,提高内河水运行业的科学管理和组织服务水平,本文从数据预处理、总体情况分析、船闸运行分析、货物运输分析4部分对江苏省过闸数据开展研究,更全面地分析内河水运状况,以期获得更准确的结论。

3.1 数据预处理

本研究采用的船舶过闸信息数据量大,字段信息多,存在着包括数据重复、数据缺失、数据异常、数据杂乱等一系列问题;因此,在数据分析之前需要对所采集数据进行数据清洗,确保消除所有的“脏数据”。

(1)重复数据清洗。船舶过闸信息重复填报和系统故障都可能导致数据库中出现重复的记录。针对数据重复的情况,在数据预处理阶段对每条过闸记录进行重复性分析,若发现相同船舶识别号在相同时刻重复填报数据,则只保留第一条记录,并将重复记录直接删除。

(2)缺失数据清洗。缺失数据是数据清洗工作解决的另一个重要问题。在数据录入过程中,由于人为操作失误、部分信息需要保密或者数据来源不可靠等各种原因,造成数据残缺,如某条记录的属性值被标记为“NULL(无)”或空缺等。一旦不完整、不准确的数据用于数据分析,则会影响分析结果的准确性。如果过闸数据中重点研究字段的缺失比例较小,可以通过直接删除重点字段缺失数据来进行清洗。

(3)数据格式统一。船舶过闸信息数据中存在同类数据或者不同数据的同类字段的格式不统一问题。在数据录入过程中,由于各系统之间的差异、操作人员的失误或者数据传输过程中产生的问题等原因,使得数据集中的数据格式不一致,这样也会导致分析过程中的报错,甚至严重影响数据分析结果的精确度。如时间字段在两种数据中分别被存储为“29-10月-18 03.51.53.000上午”和“2018- 10-29 03:51:53”,这些格式不一致的数据在后续的数据分析过程中可能会报告错误信息,因此,在预处理阶段应将其转换为统一格式的数据。

3.2 总体情况分析

(1)航道货运数据转换。船舶在江苏省内河航道航行过程中,可能存在一次或者多次的过闸记录,如果简单地将全省过闸货运量进行累计,其结果将会远大于实际航道货运量;因此,为获得较为准确的航道货运数据,应剔除重复统计的船舶过闸记录。分析算法将过闸记录按“船名”和“过闸时间”排序后,根据“起讫点”“实载货量”“上下行”3个识别字段,剔除重复航次数据后,得到江苏省内河航道货运数据,基于此可以统计全省内河航道货运量。

(2)货物运输总体情况。剔除重复过闸记录后,根据数据中起讫点代码判断各条记录起讫点所属的行政区,在其基础上根据起讫点与船闸所属地的关系,统计全省内河货物运输的区间量、交换量以及过境量(区间量:江苏省―江苏省;交换量:江苏省―省外;过境量:省外―省外),并且分析与周边省市的交换关系。

(3)船舶、货种总体情况。根据船舶类型、吨级字段,统计全省在航船舶的吨级和类型结构组成,并且根据船闸所在通道、实载货种判别分通道的货运情况以及分货种的货运情况。内河货运总体情况分析算法流程如图1所示。

3.3 船闸运行分析

(1)船闸运行情况。根据各船闸运行记录的每一条过闸数据,计算每次过闸记录中的过闸开始时间与结束时间的时间差,累计分组即得到各船闸统计时间内的运行时长。通过船闸字段以及过闸时间字段,聚合相同船闸开闸次数的记录,即可统计全省船闸开放闸次的数据。

(2)船舶过闸分析。除了对船闸运行时间与闸次数据进行分析外,过闸船舶数量、过闸货物量以及待闸时间分析是管理部门关注的重点;因此,在过闸数据分析中,需要通过船闸字段以及过闸时间字段统计分时段的各船闸过闸船舶数量,通过船闸字段、时间字段以及实载货物量字段统计分时段的各船闸的过闸货物量,并且结合收费时间字段以及过闸时间字段,可以计算出江苏省各船闸在不同时间段内的平均待闸时间。

(3)全省船闸统计排名。通过船闸运行时长、开放闸次、过闸船舶数量、过闸货物量以及待闸时间5个分析要素,对全省52座交通部门管理的船闸统计排名,从不同的角度为管理部门以及船舶所 有人提供参考。全省船闸运行情况分析算法流程见图2。

3.4 货运流向分析

(1)起讫点识别。过闸数据记录有船舶过闸时填报的起讫点,但这两个字段是以数字编号的形式记录,需要将其与文字匹配,来识别每一条记录起讫点,还需要结合江苏省行政区划数据,将起讫点字段聚合到地级市名(外省市采用省名)。

(2)流向聚类分析。对于相同起点(省市)、讫点(省市)字段的过闸记录进行聚类分析,统计相同起讫点的船舶货运流向数据,并且结合数据中货种字段,计算不同货种的货物运输流向。剔除起讫点相同的区间货物交换记录以及不符合常理的错误数据。货物流向分析算法流程如图3所示。

4 实证分析

采用江苏省2021年全年过闸数据,结合上文阐述的分析算法对全省内河航运发展状况进行实证分析。

4.1 总体情况分析

2021年,江苏省内河货运量9.4亿t,同比减少1.3%。全省内河货运量中,省内各港口间货物交流量为5.9亿t,占比63.1%; 与其他省交流量为2.8亿t,占比29.8%; 其他省货物过境量为6 678万t,占比7.1%。2021年江苏省与其他省份间的内河货运量为2.8亿t,其中其他省到江苏的货运量占71.2%,达到2.0亿t,环比增长34.8%,全省内河水运与周边省市联动性进一步提升。安徽、山东发往江苏省的货运量位居前两位,分别达1.0亿t和7 478万t,分别占其他省到江苏的货运量的50.4%、37.6%,通过南京杨家湾船闸和徐州蔺家坝船闸等从安徽、山东到江苏的货运量大幅增长。2021年江苏省与周边省市内河货物运输情况见图4。

4.2 船闸运行分析

2021年江苏省联网收费船闸共开启60.2万闸次,环比增长2.9%;累计运行50.9万h,环比增长6.8%;过闸船舶305万艘次,环比下降1.4%;过闸货物22.3亿t,环比增长0.5%;过闸船舶平均运力为692.1 t,环比上升0.5%。2021年内河过闸船舶数量及环比变化如图5所示。

统计各个船闸过闸船舶数量,谏壁船闸、江阴船闸、淮安船闸、施桥船闸、宿迁船闸、皂河船闸、邵伯船闸、刘老涧船闸、淮阴船闸、泗阳船闸10个船闸2021年过闸船舶均超过14万艘次,主要分布在京杭运河沿线,其中谏壁船闸、江阴船闸过闸船舶数量20万艘次左右。2021年部分船闸过闸船舶数量及环比变化情况如图6所示。

从过闸货物量看,施桥船闸、淮安船闸、邵伯船闸、淮阴船闸、刘老涧船闸、泗阳船闸、宿迁船闸、皂河船闸8个船闸过闸货物量均超过亿吨,但2021年施桥船闸、淮安船闸、淮阴船闸过闸货物量环比分别下降1.4%、6.6%、5.2%,谏壁船闸、江阴船闸因所在航道等级相对低等因素,过闸货物量相对较少。

4.3 货运流向分析

2021年,江苏省联网收费船闸共过闸货物量21.1亿t,环比下降0.9%;完成内河货运量9.4亿t,环比减少1.3%,其中矿建材料、煤炭、钢铁是江苏内河货运最主要货种,分别占比44.8%、21.4%、7.3%。2021年全省内河货运雷达图如图7所示。

从货物流量流向看,内河运输货物出发地主要为徐州、无锡、南通、镇江,发出货运量分别为1.0亿t、9 149万t、8 267万t和7 139万t,分别占总发出量的15.1%、13.6%、12.3%和10.6%;到达地主要为淮安、苏州、南通、无锡,到达货运量分别为1.3亿t、1.0亿t、9 471万t、8 637万t,分别占总到达量的16.4%、13.2%、12.0%、10.9%。在内河运输中,江苏省主要与安徽省和山东省开展内河货物运输,分别完成货运量7 980万t和2 485万t,占总货运量的8.5%和2.7%。

从煤炭流量流向看,内河运输煤炭以运抵江苏省内港口为主,占发出到达量的61.2%。其中:煤炭出发地主要为徐州、镇江、无锡,发出量分别为4 111万t、1 291万t和1 143万t,分别占总发出量的43.8%、13.7%和12.2%;煤炭到达地主要为苏州、淮安、扬州、无锡和常州,到达量为2 339万t、1 816万t、1 716万t、1 625万t和1 412万t,分别占总到达量的15.8%、12.2%、11.6%、10.9%和9.5%。

从金属矿石流量流向看,出发地主要为淮安、泰州、盐城,发出量分别为1 066万t、779万t、271万t,分别占总发出量的35.6%、26.0%、9.1%;金屬矿石到达地主要为无锡、南京、淮安、徐州,到达量分别为638万t、551万t、484万t和434万t,分别占总到达量的21.1%、18.3%、16.0%和14.4%。

猜你喜欢
内河航运数据分析江苏省
江苏省交通图
江苏省政区图
对开发内河航运的建议
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
内河航运与区域经济的相关性分析
内河航运信息服务系统功能架构
江苏省纪委
江苏省人大