卫星激光测高数据土地覆盖分类应用研究进展

2019-05-17 08:18权学烽唐新明李国元刘诏薛玉彩
遥感信息 2019年2期
关键词:特征参数波形准确率

权学烽,唐新明,李国元,刘诏,薛玉彩

(1.兰州交通大学 测绘与地理信息学院,兰州 730070;2.自然资源部国土卫星遥感应用中心,北京 100048;3.甘肃省地理国情监测工程实验室,兰州 730070)

0 引言

土地覆盖是自然营造物和人工建筑物所覆盖的土地诸要素的综合体,具有特定的时间和空间属性,其形态和状态可在多种时空尺度上变化。土地覆盖类型的变化被人类活动所影响,这种影响导致越来越多的生态和环境问题,如部分动植物的灭绝、全球变暖、土地沙漠化等。因此,为实现可持续化发展,有效解决环境问题,进行土地覆盖类型监测迫在眉睫[1-2]。目前利用遥感开展土地覆盖分类的数据源多为可见光影像数据和SAR数据[3-5],使用的方法有决策树法、神经网络法、支持向量机(support vector machine,SVM)和其他方法[6-10]。近年来,随着对地观测技术的快速发展,卫星激光测高受到大家的广泛关注,我国计划陆续发射高分七号、陆地生态系统碳监测卫星。卫星激光测高由于其独特的波形数据,在土地覆盖分类方面具有一定应用价值,开展相关研究与分析非常有意义。

针对卫星激光测高数据在土地覆盖分类应用,国外学者已经开展了较多的研究。其中,2003年美国发射了首颗对地观测激光测高卫星,冰、云和陆地高程卫星(ice,cloud and land elevation satellite/geoscience laser altimeter system,ICESat/GLAS),在其运行的6年里共收集了近2亿个激光测高点数据,为土地覆盖分类研究提供了丰富的数据源。GLAS数据文件包括GLA01~GLA15,其中GLA01提供全球测高数据,它包括发射波和回波波形数据文件,GLA14是全球表面测高数据,它提供激光点的经纬度、高程及回波波形数据,Duong等人通过对回波波形特征进行分析确定土地覆盖类型,然后利用该点的经纬度通过高分辨率影像等方式对覆盖类型进行验证[11-13]。2009年ICESat停止工作,NASA于2018年9月发射ICESat-Ⅱ,在ICESat-Ⅱ发射前NASA启动了ICEBridge冰桥计划,收集这段时间内的数据进行补充,ICEBridge上搭载了陆地、植被和冰传感器(land,vegetation,and ice sensor,LVIS)激光扫描仪,LVIS具备大光斑全波形采集和记录功能并且可以用于土地覆盖分类[14]。

随着高分七号卫星和陆地生态系统碳监测卫星的发射,国产星载大光斑全波形激光测高数据将越来越丰富[15]。本文对激光测高系统在土地覆盖分类研究进展及应用现状进行了综述,总结了相关方法和发展趋势,以期为国产卫星在此方面的应用提供参考。

1 研究进展

土地覆盖类型的转变在环境变化和进行合理有效的发展规划有着重要的意义,因此土地覆盖类型分类的准确性就显得极为关键。GLAS数据应用于土地覆盖分类是近几年新的研究方向,国内外学者围绕激光全波形数据在土地覆盖分类应用方面开展了大量的研究。Pirotti认为全波形数据不仅可以提供目标的高度信息还能提供目标的一些物理信息,通过对这些物理信息的分析和处理可以更加快捷和准确地得到地物的分类信息[16]。概况而言,一般有波形特征参数法和曲线匹配法2种基于波形的地物分类方法。

1.1 波形特征参数法

波形特征参数法是指对大量返回波波形参数(如波宽、振幅和反射率等)进行处理、分析和归纳后生成特征参数,用待分类地物的波形参数与特征参数对比后分类。Duong等人提出利用ICESat的原始波形进行高斯分解,利用分解后高斯波的分解个数、波形的开始和结束位置、波宽和返回波能量这5个参数进行分类,将激光足印分为四类:高植被(高树或森林)、城市、水和裸地/低植被,实验发现在荷兰地区该方法的分类准确率为73%。Duong等人发现建筑物或其他人造物体的波宽较窄,而植物的波宽较宽,水体与裸地的波形相似[17]。Kestila等人使用Duong的方法,发现土地覆盖类型与波形之间的相关性很复杂。当土地覆盖种类发生变化时,这种变化可能是由于返回波形的错误或者其他因素造成的,因此可以通过对大量波形数据的平均化来提高土地覆盖分类准确率[18]。Ghosh在使用高斯分解法的基础上对波峰间距、坡向角和地表反射率这3个参数使用K均值(KM),中心点聚类算法(PAM)和模糊C均值(FCM)法进行分类,通过对印度Uttarakhand地区的实验发现,KM的分类准确率最高。当分类数为3类时,总体分类准确率为89.41%,当分类数上升为4类时,PAM和FCM的分类准确率下降为60%和68.4%,随着分类数的增加,PAM和FCM的分类准确率持续下降,KM的分类准确率为72.93%表现出良好的可靠性[19-21]。Kestila和Ghosh的对比分析实验结果表明,全波形卫星激光测高数据在地物类别复杂的情况下,其分类准确性会有所下降,在实验中表现为当待分类的地物类型越多时分类准确度越低。Alexander等人发现在决策树分类器中后向散射系数和振幅对于分类的准确率有较大的影响,通过应用振幅和后向散射系数的方法进行了两组对比实验,通过实验发现由于振幅值取决于飞行高度、入射角和气象条件等因素,因此具有更多的误差[22]。Cheng等人使用波形特征参数法对美国缅因州的数据进行分析和处理,抽查了500个随机样本发现Kappa系数高达0.931 7[23]。Ducic等人通过对维也纳地区的GLAS数据进行分析处理后,对植被和非植被进行了分类,其分类准确率为88.6%,Kappa系数为0.8[24]。通过上述研究表明,回波波形与土地覆盖分类的联系较为复杂,且波形的特征参数容易受到大气、辐射和云层等各种因素的影响而影响分类的精度,因此如何有效剔除这些误差从而提高复杂地物类别情况下分类准确率还需进一步研究。

1.2 曲线匹配法

曲线匹配算法是根据不同的参数使用大量的数据训练出特征曲线,用待分类样本曲线与特征曲线相匹配,根据匹配结果来进行分类。如图1所示,裸地的累计分布函数(cumulative distribution function,CDF)上升曲线近乎于垂直上升,这是因为平坦地面的能量返回时间较为集中,建筑物由于其不同高度造成返回能量的时间不同,其CDF曲线呈分段式垂直上升,而树木由于其独特的结构和不规则性使得CDF上升曲线较为缓慢,由于激光在树丛中多次反射等原因使得返回时间较长,其CDF曲线显得比较平缓。

图1 CDF曲线示意图

Zhou等人提出了一种基于Kolmogorov-Smirnov (KS)距离的曲线匹配方法,用于测量待分类波形和参考波形之间的相似性,从主成分分析(principal components analysis,PCA)出发,首先从训练数据集中提炼出一组参考波形,然后将待分类波形与参考波形使用KS距离曲线匹配法进行匹配,并将其分配给最相似的类,利用Dallas,Texas metropolitan area地区(住宅区和商业、工业建筑的混合)的ICESat测高数据(GLAS)进行土地覆盖分类实验,实验结果表明基于KS距离分类的土地覆盖分类准确率可以达到87.2%,Kappa系数为0.80,这种方法优于使用波形特征参数法3.5%。研究还表明基于PCA方法选择的参考波形比随机选择的参考波形更好[25]。2016年Zhou等人利用全波形数据来测试曲线匹配法区分不同垂直结构物体的能力,基于原来的曲线匹配算法的基础上扩展了两组新的曲线匹配方法,第一组是测量一组未知波形和参考波形之间的曲线相似度,包括了波形面积差分均方根 (curve root sum squared differential area,CRSSDA)、波形角匹配(curve angle mapper,CAM)和Kullback-Leibler (KL) 发散。第二组测量待分类波形和参考波形的累计分布函数(CDFs),包括累计波形面积差分均方根(cumulative curve root sum squared differential area,CCRSSDA)、累计波形角匹配(cumulative curve angle mapper,CCAM)和KS距离。当使用ICESat波形数据进行空地、树和建筑物分类时,KL提供最高的平均分类准确率(87%),CCRSSDA和CCAM与KL的分类准确率很接近,并且都明显优于KS、CRSSDA和CAM方法[26]。曲线匹配算法是直接使用连续的数据进行分类,这种连续性参数在体现地物类型与波形的关系上有了很大的提升,可以看出该方法在进行城区范围内的分类效果较好,然而如何标准化地物特征曲线和曲线匹配是该方法的研究难点。

与波形特征参数法相比较,曲线匹配法更能体现波形与覆盖类型深层次的联系,但是该方法在覆盖物高度计算方面表现较差。通过Zhou等人的实验可以发现曲线匹配法在同一区域的分类准确率比波形特征参数法高,但是这不能表示曲线匹配法在所有区域都优于波形特征参数法,且没有对比2种方法在多分类数时的准确率,因此这2种方法的优劣性还需进一步实验来说明。

1.3 全波形激光数据和其他数据多源融合

当使用星载全波形激光测高数据作为唯一数据源时,大多数地表覆盖的分类准确率较好,但是当地物在垂直结构和物理性质较为相似时分类结果就会较差,因此仅仅依靠星载全波形激光测高数据进行精确的土地覆盖分类难度较大,融合其他数据能弥补全波形激光测高数据作为单一数据源的局限性,可以提高土地覆盖分类的准确率。

Liu等人通过联合使用ICESat与Landsat多光谱图像来提高土地覆盖分类的准确率。该研究在中国河南省将土地覆盖种类分为耕地、林地、灌丛、水体和裸地,使用随机森林(random forest,RF)法进行特征选择,支持向量机进行足印的分类,研究发现单一使用波形或多光谱影像进行分类的准确率约为85%,而联合使用两种数据进行土地覆盖分类时准确率可以达到91%。当分类具有相同垂直结构特征的对象时可以使用光谱特征进行进一步识别。同样地,当遇到具有相同光谱特征的对象时可以使用垂直结构特征进一步识别,这种方法可以大大提高分类的准确率[27]。Ranson等人在西伯利亚地区利用GLAS波形数据和MODIS影像对该地区的森林树种进行了分类实验,实验发现由于各个树种的高度和其他物理属性的差异,其回波的特征参数具有一定的分布规律,利用这些分布规律和MODIS数据可以提高分类的准确率[28]。周梦维等人提出了一种基于机载激光雷达和航空光学影像数的多源遥感数据融合的高精度地物信息提取和分类方法,通过对张掖地区的数据进行实验和分析发现,该方法可以对平坦地形区的几种典型地物进行有效的分类,特别是针对水体、建筑物、高大植被、田埂等地物的分类准确率较高,总体分类准确率为93%[29]。Chehata等人通过使用全波形机载激光雷达数据与RBG图像数据的结合,使用SVM和RF 2种分类器进行对比实验,结果表明在相同的训练样本个数和时间内,RF分类器的性能优于SVM,错误率仅为4.25%,其对建筑物和人造物的分类结果较好,这种方法在城市区域的土地覆盖分类拥有较好的应用前景[30]。多源数据融合是未来遥感发展的一大研究重点,将全波形激光测高数据与其他数据结合使用可以有效提升分类的准确率。

2 应用现状

土地覆盖种类较为繁杂,但目前星载激光测高数据土地覆盖分类研究的具体应用主要集中于以下3个方面:城区覆盖分类、极地覆盖分类和林业树种分类。这是因为城区的覆盖分类与人类的生活活动息息相关,该方面研究可以提升城市空间的有效利用和对未来发展的合理规划;极地是目前研究的热点,针对极地的研究可以发现极地海冰厚度等因素与全球气候变化的联系与影响,针对极地区域的覆盖分类研究还可以为建设科考站提供选址参考;林业树种研究一直是农林研究的热点方向,将星载激光测高数据应用于树种分类为林业应用提供了新的参考。

2.1 城区地表分类及建筑物高程变化检测

城区地表分类集中于建筑物、道路和绿化带等城区常见类型进行分类,以期能为城市规划建设提供帮助。Mallet等人利用全波形数据的特征参数通过支持向量机(SVM)进行城区范围内的分类,实验发现将城区的覆盖分类分为建筑物、植被、自然路面和人造路面这四类的分类精确度为92%,研究人员还提出通过改进SVM的内核、迭代地处理SVM分类或直接使用全波形数据的向量来进行实验可以进一步提高分类的准确率[31]。Mallet等人将分类种类设定为建筑物、地面和植被三类。首先对激光雷达波形进行处理,得到具有两组不同形态特征的三维点云。然后利用监督支持向量机分类器对三维点云进行分类。每个点都与一组包含完整波形特征和来自离散返回数据的特征相关联。通过3种特征选择算法对三类问题的相关性进行评价。根据分类性能,选择不同的特征子集,并对分类结果进行比较。使用SVM对训练样本全波形的振幅、波宽等参数进行训练后发现最佳分类决策和最小分类子集,然后再对分类样本进行分类,实验发现在分类时,返回波的振幅以及由横截面和后向散射系数辐射定标计算出的2个特征元素在分类上有很大的帮助,该分类方法的准确率可以达到95%[32]。Cheng等人使用高斯分解波形表示在激光光斑地面目标不同层次的方法,对 2003年到2008年北京城市建筑物高度变化研究,该方法将城市变化研究从二维平面扩展到三维空间,提高了研究精度,是对现有遥感方法的补充[33]。

2.2 极地地表覆盖分类

极地地表覆盖分类是针对冰、雪、岩石和水体进行分类,希望通过对这些典型地物连续的检测发现人类活动对极地地表覆盖变化影响和对极地航道的影响。Molijn等人通过对南极洲Dry Valleys地区的冰川、岩石、雪和湖冰进行分类,其分类后的Kappa系数为0.999 3,并且发现根据接受回波能量的大小,系统对探测器前置放大器的电压进行了调整,当记录器变饱和会影响峰度、反射率等形态数值,所以首先要对记录器是否饱和进行判断。反射率对区分雪是至关重要的,通常情况下雪的反射率都是大于0.6的;峰度是区分水和其他种类的标准,在非饱和情况下,水的峰度一般都很高;波宽在进行冰和岩石时有很大的潜力[34]。谭继强等人利用Molijin的方法,使用反射率、饱和能量矫正数据、波形峰态和波宽等参数在南极查尔斯山地区进行了针对冰、雪、水和岩石的分类实验,实验发现该方法可以提高冰、雪的分类准确率[35]。这表明激光测高数据在极地地表覆盖分类上有很好的应用前景。

2.3 林业树种分类及其他应用

对林业树种进行分类可以了解树种的分布情况,估算生物量,对森林病虫害等灾害进行有效的预防。Nelson等人利用了GLAS数据对西伯利亚中部的森林和树种进行了分类,并且通过分类计算出了各树种所占面积,通过与MODIS数据处理后的结果相比较发现结果相差不超过1.1%[36]。Yao等人对巴伐利亚国家森林公园的针叶林和落叶林等林区进行分类,其分类准确率在93%以上[37]。因此,通过对不同时间段的数据对比进行分类也是全波形数据分类的方法之一。Neuenschwander等人通过实验验证了波形特征参数作为监督分类器的输入项的性能,该实验发现,能量比和振幅在进行分类时使用的最为频繁,且第一峰值上升时间和最后峰值下降时间对于区分不用的树种和密度有很大的贡献,该研究区使用激光测高数据的分类准确率为85.8%,而使用QuickBird影像的分类准确率为71.2%,而由于输入项是激光测高的返回波形,因此对波形相似但结构不同的类还需进一步的分类[38]。

3 总结与展望

目前,卫星激光测高数据土地覆盖分类研究多为探索性研究,期望通过不同的波形处理方法与分类算法相结合来发现一种能够在大范围、多分类数时保持高准确率的分类方法。通过研究发现低分类数时卫星激光测高数据土地覆盖分类效果较优,平均准确率在90%,当分类数增多时分类效果明显下降,这可能是由于分类算法的局限性或波形处理方法的局限性导致。通过Zhou和Mallet等人的实验可以发现曲线匹配算法在低分类数时分类准确率比特征参数匹配法高,当曲线匹配算法与SVM联合使用时其分类准确率比RT(random forest)和其他分类算法高,并且该方法在城区范围内的分类效果更优,但在高程计算方面略有不及,因此波形处理方法还需进一步改善。

3.1 存在的不足

全波形激光测高数据在进行土地覆盖分类上有其独特的优势,对于异物同谱和同物异谱的地物分类时要优于使用光学影像,为研究土地覆盖类型在时空变化提供了有效的技术手段,但是星载激光数据应用还存在一定范围内的局限性,主要有以下几方面原因:

①星载大光斑激光为离散型数据,光斑之间的间距较大,不能实现光斑的连续。如ICESat地面光斑的直径为70 m,沿轨方向间隔约为170 m,垂轨方向光斑间距与纬度有关,赤道处间距约为30 km,高纬度的极地区域光斑间距约为5 km,如此大的间隔对大范围土地覆盖分类还存在不足。LVIS的地面光斑直径为25 m,光斑间距受飞机的飞行速度影响,也不能实现连续性的覆盖。

②GLAS数据的卫星重访周期较长,应用地区受轨道位置影响。目前只有2003年至2009年的观测数据,这些数据受到卫星轨道等因素的影响不能实现连续对地面的覆盖。LVIS数据受到飞机飞行区域的影响,也不能实现全球覆盖,因此多源数据融合势在必行。

③卫星激光测高受到多种因素影响,同时,地物类型增多,也会导致其对应波形的复杂度增加,因此我们还需要对土地覆盖的分类方法进行细致化改进,以提升分类的准确率。

3.2 趋势与展望

尽管激光测高数据还存在着不足,但是该数据在土地覆盖分类方向表现出的潜力是毋庸置疑的,该数据不仅能对目标物进行高度测量还能对目标物进行分类,实现了对目标物定性和定量化的测量。随着近年南、北两极在航运、天然气等方面潜力的发现,对南、北两极的探测变得极为紧迫,世界很多大国和组织都在加强星载激光雷达系统的研制。激光测高卫星已进入发展的繁荣期,随着激光测高卫星越来越多,激光测高数据也越来越丰富,一定可以广泛应用于地表覆盖分类应用,未来还可以继续从以下3个方面开展研究:

①激光测高数据结合可见光、SAR卫星数据、历史地表分类数据进行大范围的地表覆盖类型变化监测。

②与大数据技术、深度学习算法相结合,实现对地表覆盖分类精度的提高和分类处理的全自动化。

③高分七号卫星将搭载激光足印相机,足印影像与波形数据相结合可以进一步提高分类的准确率。

猜你喜欢
特征参数波形准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
冕洞特征参数与地磁暴强度及发生时间统计
基于交通特征参数预测的高速公路新型车检器布设方案研究
用于SAR与通信一体化系统的滤波器组多载波波形
高速公路车牌识别标识站准确率验证法
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
Pareto最优稀疏频率雷达波形设计