海岛(礁)、滩涂和水下地形矢量数据融合方法研究与实现

2017-10-16 03:30朱道也朱欣焰刘凌佳
地理信息世界 2017年5期
关键词:同名矢量实体

朱道也,朱欣焰,2,刘凌佳

(1.武汉大学 测绘遥感信息工程国家重点实验室,湖北 武汉 430079; 2.地球空间信息技术协同创新中心,湖北 武汉 430079)

0 引 言

海洋测绘是一切海上活动的基础和先导[1]。本世纪以来,国际国内在高度重视海洋安全和海洋经济发展的同时,也更加关注海洋测绘的发展[2]。我国在“十二五规划”中明确提出要加强海洋综合调查与测绘工作,在此背景下沿海各省陆续将海洋测绘作为重点项目纳入省基础测绘[3]。其中海岛(礁)、滩涂和水下地形的DLG数据作为海洋测绘的重要成果,它们包含了海岸线、礁石、淤泥滩、红树林滩、潮水沟、渔栅、海底电缆光缆、海底管道和水下等高线-首曲线等800多种地物。然而现有的三库测绘成果是分阶段采集的,数据精度和数据模型不一致,且存在大量重复采集的情况,最终成果也是分库存储的,这使其无法进行统一管理和更新,影响了海洋测绘成果的应用。因此,利用数据融合技术对多源海洋基础空间要素数据进行融合,获得一体化的海洋数据具有重要意义。

多源海洋基础空间要素数据融合涉及的关键技术是矢量数据融合技术,其起源于上世纪80年代,美国人口调查局(USCB)将其数字化的地图与美国地址测量局(USGS)高精度的DLG数据融合[4]。之后许多学者进行了相应研究,Yuan和Tao总结矢量数据融合包含两部分,一是通过地图匹配方法识别同名实体,建立对应关系;二是通过该对应关系消除数据之间的不一致性(几何、属性和拓扑),以实现属性共享和几何精度改进[5]。Goesseln和Sester采用合并离散对象和ICP算法来融合德国数字地形图ATKIS,其主要目的是实现几何信息的融合[6]。郭黎研究了按照用户应用需求构建地理空间矢量数据融合的方法[7]。唐文静探讨了海陆地理空间矢量数据的融合,提出一种基于多评价因素的要素合并变换算法[8]。刘亚璐,葛文等研究了海洋地理环境矢量数据融合的方法,主要包括海洋线、非海岸线等二维实现数据的融合和由数字水深点生成海底等深线三维矢量数据的融合[9]。白亭颖归纳了陆海地理信息融合实现的关键技术:语义特征融合和空间特征融合[10]。

本文结合现有的矢量数据融合技术,对多源海洋基础空间要素数据的融合方法进行了研究。我们首先采用地图匹配中几何匹配技术来识别同一区域内不同来源数据(如海岛(礁)和滩涂DLG数据)的对应关系,然后对同名实体的属性信息求并集的方法来进行属性融合,最后利用本文提出的基于中误差和对应点的方法对几何信息进行融合。为此,我们针对浙江省海岛(礁)、滩涂和水下地形基础空间要素数据的融合,基于.NET和ArcGIS Engine组件开发了海洋基础空间要素数据融合系统。

1 关键技术

1.1 矢量数据匹配

矢量数据匹配是指通过相似性指标识别出不同来源地图数据之间的同名实体,并建立对应关系的过程[11],它是矢量数据融合的前提。相似性指标包括几何、属性、拓扑和环境相似性,其中几何相似性是被最广泛使用的[12]。浙江省海岛(礁)、滩涂和水下地形基础空间要素数据属性字段不一致,几何上具有明显的自然性和多样性,因此我们利用几何相似性指标来匹配海岛(礁)、滩涂和水下地形基础空间要素数据。

点要素是不依比例尺变化的,只存在位置信息,所以点要素直接通过距离特征进行匹配。线要素是半依比例尺变化的要素,具有位置、长度、方向和形状等特征。本文选取Hausdorff距离指标来匹配线实体,Hausdorff距离对空间要素的距离和整体形状都有所反映[13],因此被广泛应用于要素匹配[14-15]。对于点集PA和PB,PA={pa1,pa2,…,pam},PB={pb1,pb2,…,pbn},Hausdorff距离计算公式为:

式中,HD(PA,PB)为点集PA和PB的Hausdorff距离,|| ||是点集A和点集B的距离范数,常用欧式距离。,表示点集合PA中每一个点到点集PB最小距离中的最大值;,表示点集合PB中每一个点到点集PA最小距离中的最大值。在实际计算中,把线要素当作一组连续的点集,通过计算点集之间的Hausdorff距离来代替线要素之间的距离。

面实体是完全依比例尺变化的要素,具有位置、大小、方向和形状等特征。本文选取面积重叠度来匹配面实体,面积重叠度特征反映匹配实体对之间位置、大小和形状特征[16]。对于存在叠置关系的面要素集A和B,A={a1,a2,…,am},B={b1,b2,…,bn},采用文献[6]中的公式面积重叠度相似度:

式中,Overlap(A,B)为面要素集A和B的面积重叠形似度。对于面实体之间的多对多对应关系,我们一般不能直接获取。如数据集A中a1,a2,…,am与数据集B中b1,b2,…,bn面积重叠度大于阈值,a1,a2,…,am应该被聚合,b1,b2,…,bn也应该被聚合,聚合a1,a2,…,am对应聚合b1,b2,…,bn。本文中,我们采用文献[6]提出的邻接矩阵方法来识别这种多对多双重聚合的对应关系,该方法在Huh匹配城市面实体时也被使用[17]。令C为p×q的邻接矩阵,p和q分别表示A和B中参与计算的面实体个数,C(i,j)的值为1或0,如果ai与bj存在叠置关系,且ai与B中参与计算的面实体面积重叠度大于阈值或bj与A中参与计算的面实体面积重叠度大于阈值,则取C(i,j)=1;反正则取C(i,j)=0。将矩阵C增加实体的自相邻关系,其表示为C',如公式(1)所示。对C'递归自乘,直到矩阵中不再有值为0的元素值发生改变,则自乘后的矩阵C"中,若C"(i,j)=1,则表示其关联实体存在对应关系。

如图1所示,1a、1b分别表示A和B中计算的面实体,1c表示其对应关系,图2a为其对应的邻接矩阵C,图2b为增加实体的自相邻关系矩阵C',图2c为递归自乘后的矩阵C"。

图1 基于重叠关系的二分图表示Fig.1 Bipartite graph representation based on overlapping relation.

图2 判别同名面匹配对的矩阵运算方法Fig.2 Matrix manipulation for identifying corresponding polygon pairs.

1.2 矢量数据融合

矢量数据融合的目的是实现属性共享和几何精度改进[5]。其主要任务包含:①消除空间实体在不同的数据模型中多次采集所产生的数据描述上的差异;②消除不同分类分级方法采集所产生要素属性信息;③消除空间实体几何位置上的差异[18]。由于本文融合数据浙江省海岛(礁)、滩涂和水下地形DLG数据不存在数据模型差异,本文主要集中在②和③方面的融合。在融合之前,我们根据现有数据源存在的情况,先对海洋基础空间要素数据的分类分级标准进行统一。

我国现有基础空间要素数据分类与代码标准有GB/T13923-92《国土基础地理信息数据分类与代码》,GB14084-93《1:500 1:1000 1:2000地形图要素分类与代码》、和GB/T15660-1995《1:5000 1:10000 1:25000 1:50000 1:100000 地形图要素分类与代码》等,对于海洋要素数据的分类还未有统一标准。现有浙江省海岛(礁)基础空间要素数据分为八大类,分别为海洋、水系、交通、管线、居民地与设施、境界线与政区、地貌、植被与土质,与陆地地形图要素分类相比,其特别增加了海洋这一大类。滩涂和水下地形基础空间要素数据分为七大类。在数据融合时,我们必须对分类标准进行统一,本文方法是采用浙江省海岛(礁)基础空间要素数据分类标准。滩涂和水系地形基础空间要素数据通过FCODE(分类编码)进行重新分类。

在矢量匹配中,匹配的类型包含1:0、1:1、1:N和M:N四类。1:1匹配对应关系简单,我们提出了基于中误差和对应点几何融合的方法进行融合。1:N和M:N匹配类型对应关系复杂,我们提出了基于TAC原则确定重要实体的方法进行融合,融合时只保留重要要素的形状信息,不重要实体作为历史信息通过版本号进行保存。同时,我们利用几何中心点代替实体集对重要信息的位置进行调整。属性进行融合时是对匹配实体对的信息求并集。

1.2.1 TAC原则

几何融合时,我们主要对几何位置进行调整,实体的形状不改变。为此我们提出了基于TAC原则的数据融合规则来确定数据融合时同名实体中的重要要素,几何融合时,我们保留同名实体中重要要素的形状信息,但根据其同名要素对其位置精确性进行改进。TAC原则包括时效性(Timeliness)、精确性(Accuracy)和完整性(Completeness)三方面,我们取首字母T、A、C来表示。时效性是指实体采集时间,数据采集时间越近,时效性越好;反之,则时效性越差。精确性是指数据表达粒度的大小,比例尺大的数据精确性越好;反之,则精确性越差。完整性是指面实体的完整性,如相同FCODE的地物,保存全部地物要素数据来源比保留部分地物完成性好。TAC原则的设定根据客户的需求来设定,本项目中设定规则为时效性>精确性>完整性。如确定同名实体a和b的重要性,若a的时效性大于b的时效性,则T(a)=1,T(b)=0,以此类推,可计算出a和b实体的TAC。假设TAC(a)=101,TAC(b)=010,则TAC(a)>TAC(b),则实体a比实体b重要。

1.2.2 属性信息融合

多源海洋基础空间要素数据信息的融合,可起到属性信息修复、改善信息丰富度等作用。如偏向测绘部门生成的数据,数据精度高,包含数据的编码信息,也可能存在部分属性信息缺乏的现象;其他来源数据偏向数据实际应用信息,但是数据的基础信息缺乏。实现这两种数据的信息融合,既可获得实体的编码等基础信息,也可获得数据的应用信息,还可进行信息修复。基于同名要素的属性融合,就是求取同名要素属性信息的并集,获取更加丰富的属性信息。

不同来源的同名实体往往具有不同属性项,对同一属性的定义可能不同,所以属性信息融合的难点是解决同名异意和同意异形的问题。同名异意包含两类含义,一是属性名称相同,但是表达的意思不同。如要素包含类型属性字段,由于对类型的理解不一致。一类要素类型可能是指来源类型,如来源为海洋测绘、原有地图数字化等。另一类数据类型可能是指使用类型,如池塘按养殖分为鱼、虾、菱等类型。二是属性名称相同,但表达标准不同,如对道路分级数据字段,可能采用的道路分级标准不同,造成表达的不同。同意异形是指属性字段不同,但是表达的意思相同。对于这两类问题,还没有特别好的自动解决方法,需要人工加以判断。

1.2.3 基于中误差和对应点的几何融合方法

中误差是衡量观测精度的一种标准,也称为“标准差”, 其计算公式为

ρ表示中误差,(xi,yi)表示第i次的观测值,(x0,y0)表示真实值。在制图规范中,观测点和控制点的位置中误差的概率分布曲线呈正态分布或类似正态分布[19],且规定比例尺的DLG数据的中误差范围是固定的,其中误差随着比例尺的变化而变化,因此,中误差可作为测绘成果DLG数据质量评价的指标[20]。本文中,我们提出利用中误差作为同名实体几何信息的融合标准。对于通过实体匹配技术获取的不同比例尺不同来源的对应点(x1,y1),(x2,y2),…,(xn,yn),其比例尺分别为s1,s2,…,sn,查询其中误差分别为ρ1,ρ2,…,ρn。由于不同来源数据误差范围不同,所以不采用常用的等价权来设置对应点的所占权重,本文根据各对应点中误差范围大小来设置权重,中误差越小,则权重越大;反之,则权重越小。根据各点所分配的权重,融合后坐标为:

式中,(x',y')为所有对应点融合后的坐标。针对1:1匹配,对于点实体,我们可通过匹配结果直接获取对应点。对于线实体,我们将线实体分为有序排列的点集来进行融合。假设a和b匹配,将a和b分别按照弧长和均分,则在a和b中分别取n个点V(a)={va1,va2,…,van}和V(b)={vb1,vb2,…,vbn},其按线实体轮廓轨迹排序,式中,vai和vbi是对应点。按照上文中公式计算融合后给点坐标V'={v1',v2',…,vn'},之后我们按照原有轮廓的顺序将融合后点集连接起来,生成新的线实体。面实体融合方法与线实体一致。

针对1:N和M:N匹配,我们首先通过凸包对实体集进行联合,然后获取该凸包的几何中心点,其计算公式为:

然后利用公式(5)对重要实体位置进行调整。

2 系统设计与实现

2.1 系统总体框架

一体化海洋基础空间要素数据库的设计以浙江测绘局提供的1:2000比例尺的岛礁海洋基础空间要素数据库、1:10000比例尺的滩涂海洋基础空间要素数据库和1:25000比例尺的水下地形海洋基础空间要素数据库为基础,建成之后称为海洋基础库。这些地理实体数据具体包括海洋要素、境界与政区、水系、居民地及设施、植被与土质等。

浙江省海洋基础空间要素数据融合系统根据海洋基础库融合的功能需求,采用具有较强事务处理能力的C/S结构模式进行搭建,使用ArcGIS Engine10.1组件进行二次开发,使用当前流行的.Net技术,选用Microsoft Visual Studio2010为开发平台,开发语言为C#。

海洋基础库融合系统可分为三层设计:最底层为数据库层,主要是浙江省现存的海岛(礁)、滩涂和水下地形三个独立存储的数据库;中间层依托本文提出的属性融合技术和基于中误差与对应点的几何信息融合技术构建四个核心模块,分别为融合准备、矢量数据匹配、三库融合和历史数据管理,是系统具体功能的实现;最上层为表现层,实现了海洋基础库的融合和管理,为浙江省海洋地理信息系统的应用以及其他相关的行业提供了基础数据的支持和服务。

2.2 系统技术路线

多源多尺度海洋基础空间要素数据融合的技术路线如图3所示,主要包括三部分:

1)分析原始数据库的属性信息和数据组织结构,设计一体化数据库的逻辑模型;分析原始数据库的存储模式,设计一体化数据库的物理模型;结合一体化数据库的数据模型最终确定一体化数据库的框架。

2)利用矢量数据叠置分析提取陆海数据的重叠区域,将非重叠区域内的要素数据确定为一体化数据库所需数据;对于重叠区域内,利用多尺度实体匹配技术识别同名要素,同名要素根据TAC规则获取主体要素,再对同名要素进行属性融合和几何融合,融合后的数据确定为海洋基础库所需数据。

3)按从整体到局部的顺序,检校一体化数据库所需数据是否满足入库要求,进行数据一致性处理,并最终存至海洋基础数据库。

图3 系统技术路线图Fig.3 System technology roadmap

2.3 系统主要功能

系统主要功能模块有融合准备、矢量数据匹配、三库融合和历史数据管理等模块,并包含常用功能,如漫游、查询、定位、数据编辑、地图绘图和地图量算功能,核心功能为三库融合功能。浙江省海洋基础空间要素数据融合系统主界面和数据融合界面分别如图4、图5所示。

图4 系统主界面Fig.4 System main interface

图5 数据融合界面Fig.5 Data fusion interface

融合准备模块主要是实现海洋基础库融合的初始化工作,主要包括融合环境初始化、融合数据初始化和融合业务的建立,如空间数据格式转换、拓扑检查、坐标转换和海洋测区范围分析等。矢量数据匹配模块主要包括矢量数据匹配和匹配结果显示。通过数据匹配,查找出变化要素,为海洋基础空间要素数据的融合做准备。三库融合模块是按照既定的规则,将三个独立的海洋数据库集成为海洋基础库,主要包括集成规则编辑、规则浏览和三库融合等功能。在做三库融合之前,需要建立一个空的海洋基础库,通过三库融合,形成一个丰富的海洋基础库。融合时不重要实体作为历史信息通过版本号进行保存,历史数据管理模块是对历史信息进行的维护和管理,为海洋数据库的服务和应用提供了决策支持。

3 结束语

本文提出了针对浙江省海岛(礁)、滩涂和水下地形基础空间要素数据的融合方法,该方法包含2个部分:①通过矢量数据匹配技术获取同名实体,点实体直接根据欧式距离来进行匹配;线实体采用了经典的Hausdorff距离进行匹配;面实体利用基于邻接矩阵和面积重叠度的方法进行匹配。②通过属性信息和几何信息融合技术对同名实体进行融合,属性信息融合主要是对同名实体的属性信息求并集;几何信息融合时我们提出了基于中误差和对应点的融合方法。本文的创新点是提出了确定融合时的重要实体的TAC原则和基于中误差和对应点的几何融合方法,未来将对1:N和M:N匹配的几何融合方法进行深入研究。

猜你喜欢
同名矢量实体
同名
矢量三角形法的应用
前海自贸区:金融服务实体
79首同名民歌《放风筝》的宗族关系
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
三 人 行
基于矢量最优估计的稳健测向方法
三角形法则在动态平衡问题中的应用