面向对象的高光谱遥感影像稀疏表示分类

2018-03-19 08:35吕道双
测绘工程 2018年4期
关键词:面向对象字典光谱

徐 锐,林 娜,吕道双

(重庆交通大学 土木工程学院,重庆 400074)

随着高光谱遥感技术的飞速发展,高光谱数据日益增多,但对高光谱遥感影像的处理能力却滞后于获取影像的能力,造成带有海量信息的高光谱影像数据无法为人所用。在遥感影像处理技术发展的初期,人们是基于每一个像元进行处理的,随着遥感影像空间分辨率的不断提高以及对影像不断深入的理解,发现每个像元之间并非是相互独立存在的,尤其是相邻的像元在空间上具有一定的连续性。于是,提出一种基于对象的遥感影像处理方法,该方法处理的基本单元为独立对象,即由一些同质像元组成的块。面向对象的方法考虑了真实地物的分布规律,同时,该方法利用了遥感影像的空间信息和光谱信息,有效地抑制“椒盐噪声”[1],在处理的数据量和速度方面,面向对象的方法均比较优越。其实际应用从最开始的土地利用[2-3]、森林管理与监测[4],到精细分类[5]、居民区与建筑提取[6]、车辆检测[7]等,应用领域逐步扩大。

稀疏表示是一种利用尽可能少的原子最优表示原始输入信号的方法,其突出的作用在于降维。针对高光谱遥感数据光谱维数高、数据量大的特点,利用稀疏表示的方法对其处理是最合适不过了。近年来,研究发现[8-11]高光谱图像具有较好的光谱稀疏性,其本质是像元光谱特征在某些基上是稀疏的[12]。Dai和Milenkovic[13]首次将基于光谱稀疏性的稀疏表示分类方法引入高光谱图像分类;Yang等[14]提出基于Fisher判别的稀疏表示字典学习(FDDL)方法,使得字典更加具有代表性。目前基于稀疏表示分类方法的研究,主要为学习字典的改进和分类器的改进,如王喆正[15]、秦振涛[16]等在字典学习中更多地考虑空间关系信息;袁宗泽[17]、宋相法[18]等改进了分类器。这些方法一开始的处理单元均是基于像素层进行的,对于高分辨率的遥感影像,处理结果往往存在零碎图斑,不符合实际地物分布。

本文结合面向对象和稀疏表示的优点,提出一种面向对象的高光谱遥感影像稀疏表示分类。该方法首先从高光谱遥感影像中提取标准的4个波段(近红外、红、绿、蓝)组成多光谱影像,并对其进行面向对象的影像分割,得到同质的对象块;接着计算每一个对象块在各个波段上的均值,用此均值来表示该对象块的属性;最后,在每一类别中选取少量的样本进行样本训练,并循环优化稀疏表示中的过完备字典和稀疏系数,训练结束后进行高光谱影像的分类,得到分类结果。其技术流程如图1所示。

图1 技术流程图

1 面向对象的影像分割及稀疏表示理论

从图1可以看出,本文研究的主要内容为两部分,即面向对象的影像分割和基于Fisher字典学习的稀疏表示分类。

1.1 面向对象的影像分割

影像分割其实质是利用一定的算法将影像按照一定的特征组合成独立感兴趣区域,通过影像分割及其基于分割的要素提取、特征提取和参数测量等,将原始影像转化为更抽象更紧凑的形式,使得更高层次的影响分析和理解成为可能[19]。

面向对象的方法是对影像区域进行特征识别和信息提取的过程,采用的是区域合并分割算法。区域合并是将具有相似特征的像元合并成一个独立的对象块,这个过程考虑了光谱特征、空间特征、形状特征。区域合并的目的是使得同一区域对象内各像素的异质性最小,仅仅考虑光谱异质性最小会导致分割结果出现不符合实际情况的零碎图斑,所以还需要考虑形状异质性标准[20]。

1.2 基于Fisher字典学习的稀疏表示

Fisher字典学习算法(Fisher Discriminative Dictionary Learning, FDDL)的目标是通过Fisher鉴别准则获取新字典,满足对应类的子字典具有较好的线性表示该类样本的能力和较弱表示其他类样本的能力[17]。

假设稀疏表示字典D=[D1,D2,…,Dc],Di是对应类i的子字典,训练样本集A=[A1,A2,…,Ac],设X是A在字典D上的编码系数矩阵,记为X=[X1,X2,…,Xc],即A≈DX,Xi是Ai在D上的编码系数子矩阵[21]。FDDL模型为

式中:r(A,D,X)为判别保真项;‖X‖1为稀疏性约束项;f(X)为附加在系数矩阵X上的Fisher判别系数项;λ1和λ2为调节参数,λ1>0,λ2>0。

对于高光谱影像来说,通过选取的训练样本A,每一个样本为一列,行数等于高光谱的光谱维数。经过字典学习的过程,得到一个列数大于行数的过完备字典D,在这个过程中加入了Fisher判别准则进行约束。利用得到的字典,对原始输入的高光谱遥感影像进行稀疏表示,求得原始影像在字典D下的稀疏系数。

2 面向对象的高光谱遥感影像稀疏分类实验

2.1 实验数据

本次实验影像是2015-08-30,马来西亚(Malaysia)米里(Miri)北部地区可见光近红外(VNIR)航空高光谱CASI影像,经过一系列的预处理及裁剪,得到影像大小为700像素×900像素,波段数182个,坐标系为WGS1984,空间分辨率为0.5 m,如图2所示。

图2 高光谱影像立方体

2.2 面向对象的影像分割

高光谱遥感影像具有数据量大的特点,若直接对其进行处理将会费时费力,面向对象的影像分割也并不需要影像的全部光谱均参与计算。于是,从高光谱影像中提取标准的近红外(波长902.69 nm,154波段)、红(波长9 692.62 nm,93波段)、绿(波长531.04 nm,46波段)、蓝(波长449.36 nm,22波段)4个波段组成高分辨率遥感影像,对其进行面向对象的影像分割,这样在一定程度上减小了计算量。在进行影像分割时需要考虑分割的尺度因子、形状因子、紧致度因子。本文经过大量实验,以相同地物尽可能地作为一个对象、不同地物作为不同对象为准则。实验最终得到尺度参数为250、形状参数为0.3、紧致度参数为0.7。分割结果如图3所示,分割结果共有对象1 336块。

将分割后的对象与高光谱进行叠加,并计算每一个对象在各个波段的光谱均值,作为该对象的统一值,代表着该对象所代表的地物。此处相同地物的均值可能存在不相等的情况。

2.3 稀疏表示分类

稀疏表示分类是在给定的字典中选取较少的原子来表示原始信息,而这个字典的获取是通过训练样本得到的,所以获取有效的训练样本也是比较关键的一步。在本文方法中,所处理的基本单元是单个对象,所以样本也是由单个对象在各波段上的光谱均值组成。基于本次实验的影像数据,现分为House1,House2,Road,Plant,BareLand,CementLand这6大类。经过人工提取每一类中若干数量且具有代表性的对象作为该类别的样本,样本的选取原则是:①具有明显区分标志的可以少取,区分难度较大的需多取,如形状规则、屋顶材质可明显区分的房屋House1可少取,屋顶与沥青里面材质相同的房屋House2需多取;②样本的选择需明确类别,如与裸地相近的稀植被地不选;③因光照或遮挡或其他情况引起的同一地物在影像上显示不同的地物需多取,如覆盖范围较广的植被和道路。将所有样本合在一块得到总体训练样本,并标记每一类样本标签号,如表1所示。本次实验每一类样本平均数量为11.3个对象,共计样本数为68个对象,占总对象数目的5.09%。对此样本进行训练,得到字典,用于后续分类。样本所选取位置如图4所示。

表1 训练样本名称、标签号、样本数

图4 面向对象稀疏分类选取的对象样本

利用人工选取的样本,进行稀疏表示得到字典,在此过程中,加入Fisher准则,通过循环优化,得到最优字典,利用字典进行稀疏表示原始输入的影像,进行分类。分类结果如图5所示。

图5 面向对象的稀疏表示分类结果

2.4 基于像素层的分类

基于像素层的稀疏表示分类不涉及到影像的分割问题,直接从影像中提取一定数量的像素作为样本进行训练。这里样本的选取原则是选取最具有代表性的区域,并且与面向对象的方法选取的样本保持重合,以便于结果比较。

在本次实验中,第一次选取样本均取10像素×10像素的样本块,共计600个像素样本,占影像总像素的0.10%。样本选取位置如图6中亮绿色色块所示。基于此进行样本的训练和后续的稀疏表示分类,得到分类结果,见图7。此次分类结果存在错分类与漏分类的问题,如House1类地物没有很好地分别出来;House2类与Road类被划分为同一类;Plant类、BareLand类以及CementLand类存在错误分类情况。

图6 两次基于像素层分类选择的样本位置

图7 第一次取样本基于像素层的分类结果

基于第一次选取的样本效果不理想,在原样本的基础上增加一倍的样本数量,增加样本也同样取10像素×10像素的样本块,样本选取位置如图6中亮黄色色块所示。加上第一次选取的样本数共计1 200个像素样本,占影像总像素的0.2%。基于此进行第二次样本的稀疏表示分类,分类结果如图8所示。分类结果只被分了2类,主要为道路类和非道路类,比第一次选取样本分类的结果更加模糊粗糙。

图8 第二次选取样本的分类结果

2.5 实验结果分析

对比两次实验,现从样本、计算时间、分类结果3个方面进行分析。

基于像素层的样本选取和基于对象的样本选取均是人工目视选取,样本的数量均取决于实验对象各类别之间区分的难易程度,在样本选取工作量上,这两种方法处于一个级别。但基于像素层样本的选取无法达到像基于对象方法那样具有广泛的代表性,基于对象的样本对象相当于像素层里同类的多个像素样本。若基于像素层选取样本想要达到基于对象层一样的效果,则势必会增加样本选取的工作量和计算量。

稀疏表示分类过程中计算量是由训练样本的数量和实验区待分类遥感影像大小决定的,稀疏表示分类主程序耗时见表2。可以看出基于像素层第一次样本的稀疏表示分类在运行时间上是基于对象的3.6倍左右,第二次样本的分类是基于对象的11.6倍左右。随着样本增加一倍,基于像素层的稀疏表示分类耗时增加了近3.3倍。

表2 本文两次实验耗时比较

分类结果的优劣是取舍一种方法最主要的指标。本文中两次基于像素层的稀疏分类表示在分类结果中表现出错分类、漏分类现象,尤其是对同谱异物现象,分类结果较为失败。从图7、图8均可以看到,House1类地物始终无法正确地被区分出来,沥青道路与沥青屋顶的房屋无法有效地区分开,Plant类、BareLand类以及CementLand类存在错分。同时,基于像素层的稀疏表示分类存在零碎图斑现象,这也与实际地物不相符合。而面向对象的稀疏表示分类则很好地解决了这些问题,虽然也存在一定的偏差,但是原始遥感影像的分辨率及实际地物的复杂程度也影响地物的分类结果。

3 结语

本文提出一种面向对象的稀疏表示分类算法,将面向对象的影像分割与稀疏表示分类相结合,同时在稀疏表示字典学习过程中加入了Fisher准则。该方法取得了一定的效果,但也存在一定的不足:

1)面向对象的影像分类的精度和准确度需要进一步的研究,因为这决定后面分类的准确度;

2)样本选取存在一定的人为感性认识;

3)系数表示分类的算法还需要优化,以求更加快速更加准确地得到高精度的分类结果。

[1] YU Q, GONG P, CLINTON N et al. Object-based detailed vegetation classification with airborne high spatial resolution remote sensing imagery[J]. Photogrammetric Engineering and Remote Sensing. 2006, 72(7): 799-811.

[2] EVANS T L, COSTA M. Land cover classification of the Lower Nhecolandia subregion of the Brazilian Pantanal Wetlands using ALOS/PALSAR, RADARSAT-2 and ENVISAT/ASAR imagery[J]. Remote Sensing of Environment. 2013, 128: 118-137.

[3] TOURE S I, STOW D A, WEEKS J R et al. Histogram curve matching approaches for object-based image classification of land cover and land use[J]. Photogrammetric Engineering and Remote Sensing. 2013, 79(5): 433-440.

[4] MALLINIS G, KOUTSIAS N, TSAKIRI-STRATI M et al. Object-based classification using Quick-bird imagery for delineating forest vegetation polygons in a Mediterranean test site[J]. ISPRS Journal of Photogrammetry and Remote Sensing. 2008, 63(2): 237-250.

[5] KIM M, WARNER T A, MADDEN M et al. Multi-scale GEOBIA with very high spatial resolution digital aerial imagery: Scale, texture and image objects[J]. International Journal of Remote Sensing. 2011, 32(10): 2825-2850.

[6] MENG X, CURRIT N, WANG L et al. Detect residential buildings from lidar and aerial photographs through object-oriented land-use classification[J].Photogrammetric Engineering and Remote Sensing. 2012, 78(1): 35-44.

[7] SALEHI B, ZHANG Y, ZHONG M. Automatic moving vehicles information extraction from single-pass world View-2 imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing. 2012, 5(1): 135-145.

[8] WU J J K, FANG Y.Hyperspectral image compression based on the framework of DSC using 3D-waveIet and LDPC[C]. Proc. SPIE.2009.

[9] CHARLES A S, OLSHAUSEN B A, ROZELL C J. Learning sparse codes for hyperspectral imagery[J]. IEEE Journal of Selected 7ropics in Signal Processing, 2011, 5(5): 963-978.

[10] VALIOLLAHZADEH S, YIN W. Hyperspectral data reconstruction combining spatial and spectral sparsity[R]. Rice University CAAM Technical Report TR10-29, 2010.

[11] SCOTT D, THOMPSON J. Probability density estimation in higher dimensions. In Computer Science and Statistics: Proceedings of the Fifteenth Symposium on the Interface, 1983, 173-179.

[12] THEILER J, GLOCE K. Sparse linear filters for detection and calssification in hyperspectral imagery[C]. SPIE, 2006: 6233-623301.

[13] DAI W, MILENKOVIC O. Subspace pursuit for compressive sensing signal reconstruction[M]. IEEE Transactions on Information Theory, 2009, 55(5): 2230-2249.

[14] YANG M, ZHANG L, FENG X, et al. Fisher discrimination dictionary learning for sparse representation[A]. Proc. Of Computer Vision (ICCV),2011 IEEE International Conference on IEEE[C]. 2011, 543-550.

[15] 王喆正. 基于字典学习的高光谱图像分类方法研究[D].南京:南京大学,2016.

[16] 秦振涛,杨武年,杨茹,等. 基于结构性字典学习的高光谱遥感图像分类[J]. 西南交通大学学报,2015,50(2):336-341.

[17] 袁宗泽,孙浩,计科峰,等. 基于Fisher字典学习稀疏表示的高光谱图像分类[J]. 遥感技术与应用,2014,29(4):646-652.

[18] 宋相法,焦李成. 基于稀疏表示及光谱信息的高光谱遥感图像分类[J]. 电子与信息学报,2012,34(2):268-272.

[19] 章毓晋. 图像分割[M]. 北京:科学出版社,2000.

[20] 戴昌达,姜小光,唐伶俐. 遥感图像处理应用于分析[M]. 北京:清华大学出版社, 2004.

[21] 陈思宝,赵令,罗斌. 基于核Fisher判别字典学习的稀疏表示分类[J]. 光电子·激光,2014,25(10):2000-2008.

猜你喜欢
面向对象字典光谱
基于三维Saab变换的高光谱图像压缩方法
字典的由来
大头熊的字典
正版字典
面向对象Web开发编程语言的的评估方法
峰丛洼地农作物面向对象信息提取规则集
星载近红外高光谱CO2遥感进展
基于面向对象的车辆管理软件的研制与开发
面向对象的SoS体系结构建模方法及应用
苦味酸与牛血清蛋白相互作用的光谱研究