地理信息保密安全评估的基本问题与对策

2024-01-29 14:42刘万增陈军赵勇李然章炜翟曦王新鹏王勇
地理信息世界 2023年4期
关键词:保密尺度测绘

刘万增,陈军,赵勇,李然,章炜,翟曦,王新鹏 ,王勇

1. 国家基础地理信息中心,北京 100830;

2. 自然资源部时空信息与智能服务重点实验室,北京 100830;

3. 湖北珞珈实验室,武汉 430079;

4. 自然资源部地理信息管理司,北京 100812;

5. 中国测绘科学研究院,北京 100830

1 引 言

众所周知,地理信息是自然和人文要素空间分布及变化的数字化描述与表达,是重要战略信息资源与生产要素,兼具空间载体和知识存量两大作用,为国防建设、经济社会发展和科学研究提供时空基底保障(刘万增和彭震中,2016)。一方面,地理信息数据是战场态势感知与可视化的基础,是赢得现代战争主动权的重要战略资源,因而成为“国之重器,不可与人”(孙宝云和沈永社,2012)。另一方面,我国生态文明建设、国土空间规划、“宜居地球”研究,以及电子商务、无人驾驶等新兴应用领域蓬勃发展,对地理信息的网络化、公开化应用提出了迫切需求,正催生着公众版地理信息的大规模生产和服务,推动着地理信息保密安全评估技术的创新发展(周鸿昌和吕雁华,2015;朱长青和任娜,2015;朱日祥等,2021)。

然而,长期以来,我国地理信息保密安全评估手段落后于地理信息产业发展的规模,无法从容应对所面临的严峻安全形势,对什么情况是密必保,什么情况非密放开,缺乏明确的技术指标和先进的评估手段,在一定程度上加剧了地理信息保密与应用的矛盾(周鸿昌和吕雁华,2015;朱长青和任娜,2015;刘万增和彭震中,2016)。如果把握不好涉密数据与非涉密数据之间的界限,容易导致保密管理过严或过宽,都将深刻影响国家安全和发展利益。在实际工作中,部分部门或单位往往选择从严管理,来被动降低技术缺位带来的涉密地理信息安全风险,不可避免地限制了地理信息的应用广度和深度(刘万增和彭震中,2016)。

为加强测绘地理信息安全保密工作,2020 年国家颁布了《测绘地理信息管理工作国家秘密范围的规定》,从是否为敏感区域、比例尺、位置精度、涉密属性、分辨率、等高距及数据范围等方面,对国家测绘地理信息管理工作秘密事项名称、密级、保密期限及知悉范围等进行了详细规定,为地理信息安全评估提供了政策、法规依据。但由于缺乏有效的技术支撑,我国的地理信息安全评估工作还主要依赖有经验的技术人员对地理信息数据逐一进行检查判断,检查效率低、检查范围小、结果不全面,难以得到科学的评价结果,更难以应对大批量涉密地理信息数据的保密安全评价,成为制约我国地理信息保密安全评估的技术瓶颈。

当前,我国正在实施以数字化改革推动高质量发展的国家战略,地理信息作为基础性、战略性信息资源和生产要素,将发挥重要的支撑作用。统筹发展与安全,开展地理信息保密安全评估技术创新,处理好地理信息安全与应用的矛盾,全面支撑国家各领域的数字化发展,是当前做好地理信息安全监督管理工作的迫切需要,也是地理信息管理部门贯彻总体国家安全观的重要使命。

2 国内外研究现状

地理信息保密安全评估是近年来我国地理信息安全监督管理工作面临的新问题,其研究刚刚起步,相关研究文献还很少,因而,该问题的解决需要借助传统的数字化测绘技术和人工智能、大数据等现代信息技术,探索出一种适合我国国情的地理信息保密安全智能化评估方法,重点解决碎片化数据尺度自动判断、地形图精度高效评估、遥感影像敏感信息智能识别等核心技术。本文从地理信息数据空间尺度判定、地形图精度评定、遥感影像智能认知三个方面,分析国内外学者在该领域研究现状和趋势。

2.1 地理信息数据空间尺度判定

尺度是地理数据的基本特征,作为地图学、地理科学研究的核心问题,受到国内外众多学者的关注(Lam 和Quattrochi,1992;李霖和李德仁,1994;刘凯等,2008)。尺度不变量、改变尺度的能力、尺度效应的度量、尺度作为过程模型中的参数,以及多尺度实施等为尺度的五大关键问题,因而成为国内外学者争相研究的热点(Quattrochi 和Goodchild,1997;李志林等,2018)。针对尺度不变量,李志林(2005)探讨了欧氏空间和地理空间中尺度的差别,认为随着尺度变化,对象的形状保持不变,即尺度变换具有可逆性,如不同比例尺地图上的同一条海岸线具有不同的长度值。因此,Xia和 Clarke(2023)建议使用分数维来处理地理空间的多尺度问题,将分数维看作地理空间的一个尺度不变量;Lowe(2004)研究了遥感图像的尺度不变量,通过探测某种尺度空间的响应极值来保持尺度变换不变性的特征。此外,部分学者认为地理信息尺度具有时间、空间和语义三种属性,只要这三种属性不变,地理信息尺度的不变性在一定程度上等同于这三种属性不变性(刘凯和秦耀辰,2010;张玲,2013)。

在以上研究中,分数维作为地理空间的尺度不变量,虽能为尺度判定提供理论参考,但如何量化尺度变化引起的信息量的变化,并反之将该变化量用于尺度判定,仍缺乏系统性的研究。Li 和Openshaw(1993)提出了对现实世界地形、地物数字化抽象和概括的“自然法则”原理,基于人眼观察到空间目标的复杂性是随距离变化的这一自然界普遍存在的物理规律,实现不同尺度地物的概括(Li,1996)。该原理揭示了矢量数据蕴含的尺度特征,也是一种尺度不变量,为尺度判定提供了新思路。

2.2 地理信息数据精度评估

数据精度分析和质量控制是测绘领域长期关注的热点问题(李建成等,2017;张菊清和杨元喜,2009)。相关研究多侧重于地理信息系统(geographic information system,GIS)空间数据质量的不确定性,杨元喜(2009)研究了点位误差的不同度量标准,Perkal(1956)提出了线元不确定性度量的“ε 带”指标。有学者基于上述理论进一步研究了圆曲线、缓和曲线、一般曲线、面的不确定性模型(Shi,1997;史文中等,2000;郭同德等,2003)。刘文宝等(1998)用随机过程理论推导了“De 带”的边界线方程,并提出了面位误差环的概念;游扬声(2005)提出了线元的整体误差带,对误差带进行了扩展。靳燕(2014)用区间数理论研究了位置不确定性的大小。以上空间数据不确定性研究侧重于数据的误差分布特征,而地形图精度评估关注的是给定范围地形数据的整体位置精度。传统的方法是采用测量仪器,选择一定数量的地物特征点进行实地测量,将测量坐标与待检地形数据中的同名点坐标进行比对,计算相对中误差,如美国于1998 年发布的空间数据精度国家标准(National Standard for Spatial Data Accuracy,NSSDA)中,定义了空间数据定位精度的统计和测试方法。该方法要求对地图精度进行评估时,地图覆盖的地区至少应分布有20 个控制点;而STANAG 2215 标准中,则明确定义了对每张地形图精度进行评估,至少需要167 个明确定义的控制点(El-Mowafy,2005)。在实践上,Bozic 和 Radojcic(2011)对每张地形图布设了190 个控制点,评估了塞尔维亚军事地理研究所制作的1∶50000 数字地形图的水平精度;Doskocz(2010)基于全站仪测量数据、正交和极地测量数据,分析在大比例尺数字地图水平精度。伍素贞等(2012)将在AutoCAD 中拾取的若干地物点与RTK 采集的相应点进行对比,评估地形图精度;赵鹏等(2020)利用三维激光扫描仪采集的地面点坐标检测数据,检验了大比例尺地形图的数学精度,探讨了基于三维激光扫描技术质量检验的可行性。

以上两种方法都存在成本高、效率低的问题,无法用于大区域地形图精度评估。

2.3 遥感影像内容识别

遥感影像内容识别在某种程度上是对影像内容的判读和检索。较早的研究是基于图像底层视觉特征(如色彩、纹理、几何形状)构建相似性测度指标来对图像内容进行检索查询,即基于内容的图像检索(content-based image retrieval,CBIR)技术(李向阳等,2001;Lee 等,2005;Li 等,2012;Li,2014);然而其实际性能往往受制于图像数据本身的视觉特征复杂程度(Liu 等,2007;李士进等,2010)。有研究表明,影像地物语义信息的引入可明显提高CBIR 系统的智能性和精确度(Kang 等,2011)。Liu 等(2012)在遥感影像分割的基础上通过EM 算法建立地物目标、影像特征与分割区域之间的语义化关系来实现遥感影像的区域检索;Wang等(2013)以面向对象分类结果为基础,利用影像整体视觉特征和地物方位关系的描述构建了相应的遥感影像检索系统;dos Santos 等(2013)在多尺度分类结果的基础上,引入自然语言处理中的词袋模型(bag of words model,BoW)来影像特征及其关系的高效检索。

可以看出,传统影像内容与语义的检索方法仍是以底层视觉特征间相似性或影像语义关系为主,很难做到对影像全局的场景化理解与识别。因此,近年来将时空场景认知与内容检索结合成为新的研究热点,Wang 等(2001)通过概念领域模型来描述影像中对象空间关系,实现了基于影像对象的场景化语义检索。Zhao 等(2012)为了缩小基于内容的图像检索中用户查询概念和低层次特征之间的差距,采用基于支持向量机(support vector machine,SVM)分类理论的相关性反馈算法来提高遥感图像的检索精度。闫利等(2022)利用多尺度遥感影像基准网与多形态、多时相的自然资源典型地类样本库,通过深度学习技术达到了较高的影像分类精度。

因此,利用影像自身的内容信息,结合国家级多尺度、多时相海量遥感影像数据库进行对比检索,成为解决“无来源信息、无定位信息、无参考信息”的“无源”影像安全评估的基本思路。

3 基本问题

地理信息保密安全评估是按照国家相关法律法规、标准规范等,采用信息化的技术手段,对地理信息的保密安全风险进行科学评价,给出可公开、不涉密、涉密及其保密等级、保密期限、适用范围等评价。这就涉及评价指标的选取和计算,其中,地理信息数据的涉密属性、数据范围和等高距等信息可以通过数据解析或语义识别加以判断,但对于碎片化数据的比例尺、分辨率、敏感内容的判断就比较复杂,其本质上是定量和定性结合、主观和客观交融的认知问题,目前尚没有高效可行的解决方案;另外,地形图平面相对精度的低成本、高效率地计算和评估,一直是GIS 数据质量研究领域面临的技术难点之一,也是制约地理信息保密安全评估智能化的瓶颈问题。因此,本文主要从数据空间尺度计算、地形位置精度评定、影像敏感内容识别三个方面讨论地理信息保密安全评估的基本问题。

3.1 空间尺度的智能识别问题

空间尺度是指最小的可辨识单元所代表的特征长度、面积或体积,是人们认识地理空间、进行地理建模和表达的基础和前提(李志林,2005;李志林等,2018)。空间尺度的判定主要针对无源碎片化地理信息,在缺乏元数据,没有空间定位信息的情况下,对碎片化的矢量或栅格数据的尺度特征进行计算和综合判断,实际上是对数据空间或符号空间蕴含的空间特征或模式认知的问题,需要融入时空场景认知的理论和方法,在非线性高维空间进行尺度识别的模型构建和算法实现,显然,以处理低维线性空间问题见长的数字化测绘的技术手段很难满足需求。

3.2 位置精度的高效评估问题

位置精度的评估技术瓶颈在于如何高效率、低成本地获得空间对象位置的真值。传统采用同名点坐标进行比对来衡量待检地形数据精度(El-Mowafy,2005;Bozic 和Radojcic,2011;赵鹏等,2020)的方法存在成本高、效率低的问题,无法用于大区域地形图精度评估。因而,人们往往按照地形图的比例尺推估其精度,而实际上,不同部门、不同数据生产方式生产的同一区域相同比例尺的地形数据,其实际精度变化幅度非常大,采用这种方法评估出来的精度,其可靠性很难完全满足需求。因而长期以来,地形数据精度评估一直是GIS 领域的一大难题。

3.3 影像敏感信息的场景化认知问题

影像敏感信息认知也是一种非线性高维空间的认知计算问题,需要引入混合智能计算范式,将敏感区域影像判读知识和深度学习算法进行多模态、多节点耦合,依据几何纹理形态的尺度不变性规则,对影像进行目标识别与语义分割,提取敏感地物的实体特征,计算其间的拓扑、方向及度量等空间关系,从而突破低维线性空间数字化测绘的技术局限,实现对影像敏感信息场景的认知与表达。

综上,地理信息保密安全评估是我国实施地理信息安全监管的迫切需求,面临高效率、自动化评估的技术瓶颈,需要解决地理信息数据智能化尺度判断、时空场景认知和自动化精度评估三个方面的科学问题。

4 研究思路

可以看出,地理信息安全评估存在的基本问题涉及非线性高维空间的认知计算,单单采用常规的测绘算法很难有效解决,需要充分利用人们在长期测绘生产实践中形成的测绘智能,与深度学习、测绘算法等深度融合提出一种新的解决思路。

近几年迅速发展的深度学习、群体智能、知识图谱等人工智能技术,为自然测绘智能的挖掘、提取、描述、表达提供了新手段。为此,本文针对国家地理信息安全监管对地理信息数据安全智能化评估技术的迫切需求,借助智能化测绘的理念,基于现代信息技术,将人类在长期测绘活动中积累的丰富的感知、认知等自然智能,与机器的计算智能有机融合,形成以知识为引导、算法为基础的测绘混合智能计算范式(刘经南和高柯夫,2017;王家耀,2017;宁津生,2019;艾廷华,2021;陈军等,2021;龚健雅等,2021;李清泉等,2021;李志林等,2021;刘万增等,2021;闫利等,2021;杨元喜等,2021),破解地理信息安全评估中高维、非线性的求解难题。

如图1 所示,基于这一理论框架,拟将尺度效应、空间约束及时空关联等智能机理,与深度学习、测绘算法等结合,建立地理信息保密安全评估知识库和指标体系;突破碎片化地理信息尺度计算模型、地理信息数据精度自动化评估模型、遥感影像安全评估场景化认知模型的构建方法;以此为基础,研制地理信息数据安全智能化评估系统,实现地理信息尺度计算、敏感属性过滤、相对精度评估、典型敏感区域判别等功能,支撑地理信息保密鉴定、数据定密、安全评价、公开化处理等安全监管业务,逐步形成“控得住”“管得好”“用得顺”的地理信息保密安全评估与监管技术体系,为国家地理信息安全和社会化应用提供精准化、智能化的技术支撑。

图1 研究思路图Fig.1 Research framework diagram

5 主要对策

根据以上研究思路,从以下五个方面开展研究,解决地理信息保密安全评估的关键技术问题。

5.1 构建地理信息保密安全评估知识库

收集地理信息保密安全评估的相关法律法规、典型案例、文献资料、技术标准等,对其进行评估知识抽取与关联化处理,建立地理信息保密安全评估的基础知识库;针对空间基准数据、遥感影像数据、地形数据、地图数据及三维实景等数据产品,分析提出其安全保密等级判定的关键因子及其单一或综合的量化指标,与基础知识库进行关联,构建多类型地理信息数据产品安全指标评估的知识模型与评估方法。利用时空知识图谱与图神经网络关系计算等技术方法,实现基于测绘知识推理计算的自动化评估。

5.2 研究无源碎片化地理信息尺度智能计算模型

分析不同尺度地形矢量数据的尺度特征,揭示地理信息数据空间尺度的变换机理;融入自然法则的原理,分析地形图数据的尺度不变特征,挖掘提取其尺度不变量,来计算和表征地形矢量数据的尺度,发展基于尺度统计特征的地理信息矢量数据尺度计算模型。基于地理信息数据尺度特征的知识引导,结合深度学习的正负样本特征提取能力来模拟人类地图认知表达,设计高效、可靠的碎片化栅格地图数据尺度智能识别算法,实现矢量、栅格两种模态无源碎片化地形图数据的尺度智能化判定。

5.3 突破地理信息数据相对位置精度自动化评估方法

制约地形图相对精度智能化评估的瓶颈在于如何得到数字空间地形要素的真实位置。针对大范围、多要素、多尺度的矢量地形图精度评估效率低、可靠性差等缺陷,研究几何特征自洽的地形数据相对精度评估方法。利用人们在长期测绘实践中形成的测绘智能,凝练出与地形图几何精度相关的典型要素几何特征,并映射到数字空间。形成典型地形要素(如道路、河流)的内部几何结构的约束条件,并将其转化为普适的数学模型(如公路平曲线半径),作为数字空间要素几何形态参数的“真值”,实现地形图相对精度智能、高效、便捷评估。

5.4 发展基于混合智能的遥感影像敏感信息场景化认知方法

影像敏感信息场景识别是一种非线性高维空间的认知计算问题。构建面向遥感影像敏感区域地理场景认知的知识图谱数据库和多时相、多尺度的海量遥感影像敏感信息样本库,针对影像敏感区域几何结构、纹理特征、分辨率等安全评估决策因子,分别构建其影像判定的大规模深度神经网络。再结合深度学习多任务中先验归纳知识(inductive knowledge)嵌入的技术方法,将敏感区域影像判读知识和深度学习算法进行多模态、多节点耦合。依据几何纹理形态的尺度不变性规则,对影像进行目标识别与语义分割,提取敏感地物的实体特征,计算其间的拓扑、方向及度量等空间关系,实现基于空间知识图谱的遥感影像内容检索与敏感区域智能识别。

5.5 研制地理信息数据安全智能评估原型系统

基于以上模型和方法,研制地理信息数据安全智能评估原型系统,实现地理信息尺度计算、敏感属性过滤、相对精度评估、典型敏感区域判别等功能,经过不断优化迭代,形成国家地理信息保密安全评估的支撑软件,逐步向各省及各行业示范和推广应用。

6 结束语

地理信息保密安全智能化评估是当前国家地理信息安全监管提出的迫切需求。本文在国内外文献分析的基础上,指出了地理信息保密安全智能化评估的基本问题;借助智能化测绘的理念,将人类的自然智能与机器计算智能有机融合,设计了基于混合智能的地理信息数据安全评估的技术框架,明确了地理信息数据安全评估的基本任务。客观地讲,实现地理信息数据安全评估智能化还有很长的路要走,许多关键技术、指标体系、标准规范、运行机制、服务模式等还有待进一步研究和解决。可喜的是,在总体国家安全观的指导下,我国各级测绘地理信息主管部门正在全面推进构建新一代的地理信息安全监管的技术体系,地理信息数据安全评估作为其核心技术,必将迎来前所未有的发展机遇,在国家地理信息安全监管和社会化应用中发挥更加广泛和深入的保障作用。

猜你喜欢
保密尺度测绘
多措并举筑牢安全保密防线
《信息安全与通信保密》征稿函
财产的五大尺度和五重应对
浙江省第一测绘院
工程测绘中GNSS测绘技术的应用
04 无人机测绘应用创新受青睐
无人机在地形测绘中的应用
宇宙的尺度
论中国共产党的保密观
9