基于元数据的普通国省道数据资源可用性框架设计与应用

2022-09-15 11:36刘秀红郭建华
无线互联科技 2022年14期
关键词:国省道平均速度可用性

刘秀红,曾 理,郭建华

(1.江苏省交通运输厅公路事业发展中心,江苏 南京 210004;2.东南大学智能运输系统研究中心,江苏 南京 211189)

1 背景和意义

道路交通数据资源是道路管理者和使用者进行管理与决策的基础,研究交通数据资源可用性对挖掘公路数据资源价值具有重要意义。随着普通国省道数据资源的数量和种类不断增多、道路交通业务需求和要求不断提高,快速并准确地找到可用的交通数据资源成为交通行业日常业务之一。因此,本文从交通业务与数据的角度出发,建立普通国省道数据资源可用性框架,充分挖掘公路数据资源价值,以提高交通数据资源可用性。

交通数据资源的可用性是指针对特定需求,能快速并准确地找到有用的交通数据资源。提高交通数据资源可用性不是简单的数据处理,它涉及对道路交通数据资源的采集、处理、集成和搜索。更重要的是,需要搭建业务与数据间的关联关系。通过分析路网业务需求、梳理交通数据类别,搭建业务与数据间的关联关系,建立普通国省道数据资源可用性框架,在提高交通数据资源可用性方面发挥重要作用。

普通国省道数据资源可用性框架的提出,为道路管理者和使用者进行管理与决策提供了指导。本文采用元数据分析法进行可用性分析,建立的可用性框架由物理层、服务层、元数据层和工具层4部分组成。首先,可用性框架可以分析路网业务需求,根据运行监测、协调调度、事件处置和出行服务等业务衍生出的不同业务功能点,构建典型业务元数据库。其次,可用性框架可以梳理交通数据类别,从采集数据,到质量控制及融合处理,再到构建数据元数据库,完成交通数据资源的梳理和处理,便于其储存与查询。再次,可用性框架可以连接业务与数据,通过搭建业务功能点与交通数据类之间的关联关系,构建数据集成元数据库。最后,可用性框架还可以提供工具,指南文档、搜索工具、可视化分析,能提高交通数据资源的搜索效率与展示效果。此外,以路网平均速度为例,对数据资源可用性框架进行展示。

2 可用性分析方法

数据资源主要以数据的形式呈现,而元数据作为描述数据属性的信息,可揭示数据资源的内容、特征和属性,具有体量小、格式简单、易被计算机读取和识别等优点。元数据的目的是识别、评价、追踪资源信息以达到有效管理,有助于数据资源可用性的实现,即快速并准确地找到有用的数据资源。根据用途,元数据可以分为数据元数据和业务元数据。数据元数据在数据存储、开发和管理过程中为系统设计者、开发者和管理者提供支持,有助于管理人员理解数据。业务元数据将业务梳理为多个业务需求点,有助于用户理解业务中的信息需求。因此,可以用元数据进行业务与数据的标准化,建立两者间的可用性联系。

元数据分析法通过搭建业务元数据与数据元数据间的关联关系,推动普通国省道数据资源可用性框架的建立。在交通中,主要有业务与数据两种信息资源。业务元数据将交通中的业务梳理为多个业务需求点,便于人们更好地理解交通业务,如评价路网运行状态的一个业务元数据是速度指标的计算,评价路网安全的一个业务元数据是事故率指标的计算。数据元数据是描述关于道路交通的数据类,其具体数值通过一定的采集技术收集并经过质量控制及融合处理得到,如流量数据作为一类数据元数据,具体的流量数值可通过感应线圈收集并经过质量控制及融合处理得到。本文在元数据分析法的基础上,建立普通国省道数据资源可用性框架,实现数据元数据与业务元数据间的可用性分析,以此提高数据资源可用性。

3 可用性框架

本文基于元数据分析法,通过对普通国省道业务及数据资源的梳理,搭建业务与数据间的关联关系,建立普通国省道数据资源可用性框架,如图1所示。

图1 普通国省道数据资源可用性框架

3.1 物理层

物理层提供道路数据资源,执行路网业务,是可用性框架的基础。为获取全面、准确、一致的道路交通信息,首先要了解交通数据如何获取。当前主要的交通数据采集方法有:感应线圈、微波、声波、视频、雷达、GPS、桥梁动态称重系统、ETC和治超检测站等,以上交通数据采集方法采集的主要数据项及其特点,如表1所示。

表1 物理层交通数据采集方法

3.2 服务层

服务层主要进行路网业务分析及数据质量控制及融合处理。一方面,服务层解决了为什么要获取、如何处理交通数据资源等问题。另一方面,服务层连接物理层与元数据层,实现了交通数据的处理与传输,推动了路网业务的分析与执行。可用的交通数据资源是道路管理者和使用者进行管理与决策的基础,对提高路网运行效率和服务水平至关重要。为此,服务层需要进行路网业务分析,典型的路网业务包括运行监测、协调调度、事件处置与出行服务等。在服务层需要对从物理层采集到的交通数据进行质量控制及融合处理,包括异常数据检测、错误数据处理、缺失数据补齐、多源数据融合等,经过以上一系列处理后的数据作为各个交通元数据的具体取值,以确保交通数据的正确性。

3.3 元数据层

元数据层通过元数据分析法构建元数据库,实现业务与数据间的可用性连接,是可用性框架的核心。同时,元数据层还连接服务层与工具层。(1)在服务层进行路网业务分析的基础上,在元数据层构建典型业务元数据库,分析业务需求点,主要包括指标模型、预测模型、事件模型、应急模型和年报分析等。(2)在服务层进行数据质量控制及融合处理的基础上,在元数据层根据采集的数据类,构建数据元数据库,主要包括两类,即以流量、速度等为代表的动态数据,和以路、桥、隧等为代表的静态数据。在形成业务元数据库和数据元数据库的基础上,在元数据层构造数据集成元数据库,根据业务功能对数据的需求,建立业务元数据与数据元数据的相关关系,并放入同一数据表中供查询,以提高业务功能的可用性,如为了完成某一典型业务的某一功能点,可以根据业务元数据和数据元数据之间的关系,迅速查找到所需要的静态和动态数据,借此提高面向业务的数据资源可用性。

3.4 工具层

工具层为实现可用性提供工具,包括指南文档、搜索工具和可视化分析等。指南文档根据业务及其功能点和数据项及其来源,展示业务与数据间的关联关系。搜索工具通过在数据集成元数据库中进行搜索,直接给出业务与数据间的关系,例如输入某一业务功能点,搜索工具输出其所需数据类,或输入某一数据类,搜索工具输出其可支持的业务功能。可视化分析在搜索工具的基础上,实现业务功能点与数据间以图形和表格为主的视觉展示。

4 实例展示

本节采用路段平均速度展示普通国省道数据资源可用性框架。路段平均速度是某一时间段、某一路段内所有车辆行程速度的平均值。在物理层中,速度数据可来源于交调站,通过感应线圈采集。在服务层中,计算路段平均速度是运行监测业务中一个重要功能点。同时,速度数据需要进行质量控制及融合处理,可通过阈值判别法进行异常数据检测,剔除法进行错误数据处理,插值补齐法进行缺失数据补齐,加权平均法进行多源数据融合。在元数据层中,路段平均速度数据是指标模型中的一个重要指标,为计算路段平均速度,需从数据元数据库中获取路段数据和速度数据。其中,路段数据是静态数据,来源于静态基础数据库,速度数据是动态数据,来源于交调站,如表2所示。在工具层中,则可以针对计算路段平均速度的功能点,展示所需要的静态和动态交通数据。通过以上步骤,实现了计算路段平均速度业务功能点与数据间的可用性连接。

表2 路段平均速度可用性展示

5 结语

本文在元数据分析法的基础上,建立了普通国省道数据资源可用性框架,以提高交通数据资源的可用性。可用性框架由物理层、服务层、元数据层和工具层4个部分组成,物理层包括主要的道路及交通数据采集方法;服务层分析路网业务,对交通数据进行质量控制及融合处理;元数据层通过数据集成元数据库的构建,实现业务与数据间的连接;工具层提供实现可用性的工具。最后,应用路段平均速度对可用性框架进行了展示。

猜你喜欢
国省道平均速度可用性
基于文献计量学的界面设计可用性中外对比研究
基于辐射传输模型的GOCI晨昏时段数据的可用性分析
山东国省道改扩建大中修资金绩效评价研究
国省道公路改建工程设计要点简析
提升普通国省道路面大中修设计质量
空客A320模拟机FD1+2可用性的讨论
测平均速度演示仪
黔西南州烤烟化学成分可用性评价