具有分类器机制的高光谱图像特征提取方法

2024-03-20 01:09邢长达汪美玲徐雍倡王志胜
遥感学报 2024年2期
关键词:特征提取分类器光谱

邢长达,汪美玲,徐雍倡,王志胜

1.中国矿业大学 信息与控制工程学院,徐州 221116;

2.南京航空航天大学 计算机科学与技术学院,南京 211106;

3.南京航空航天大学 自动化学院,南京 211106

1 引言

作为一种先进的技术,高光谱成像具有很强的空间分辨率和光谱分辨率感知能力,近些年已经在诸多领域显示出巨大的应用潜力,比如城市绘图、气候观测、地质勘察、工业智能、智慧医疗等(Ghamisi 等,2017;梁雪剑 等,2021;章硕等,2021)。由于高光谱成像可以有效地从数百个相邻的窄光谱带捕获目标物体的反射信息,因此可以很好地反映物体的化学成分和物理形态信息(聂江涛 等,2023)。在与高光谱成像相关的研究中,高光谱图像分类(魏祥坡 等,2020;薛朝辉和张瑜娟,2022)是目前最受关注的研究方向之一,旨在预测不同对象的类别标签,实现精准观测和精细分类。

从具有复杂结构的高光谱图像中自动地提取高质量和有价值的特征是分类任务的关键,是高光谱图像智能解译的基本内容。一些方法直接将高光谱图像的光谱像素用作判别特征,并利用支持向量机SVM(Support Vector Machine)(He 等,2016)、回归(regression)(Fei 等,2012)等对这些光谱像素进行分析计算,从而预测出高光谱图像的标签信息。但这些方法仅关注图像的光谱信息,而缺乏对空间特征感知的能力。为了描述高光谱图像的空间特征信息,许多基于空间特征提取的分类方法被提出。例如,Benediktsson等(2003)提出的基于多尺度形态学的特征提取方法,通过组合开、闭运算来构建记录空间结构信息的差分形态学轮廓,取得了不错的效果。类似地,还有基于扩展形态学属性轮廓EMAP(Extended Morphological Attribute Profiles)(Benediktsson等,2005)和定向形态学轮廓的方法DMP(Directional Morphological Profiles)(Liao等,2012)。上述方法大多依赖于单特征,其分类性能往往是弱于基于多特征的方法。例如,Fang等(2017)利用4组特征(即:光谱像素、形态轮廓特征、Gabor 纹理特征、微分形态轮廓)来联合预测高光谱图像的标签,实验结果表明,相比于单特征方法,该多特征方法取得了更好的分类性能。

表示学习(Scholkopf等,2021)也为高光谱图像分类问题提供了一个有效的解决思路,常见的表示学习方法包括稀疏表示SR(Sparse Representation)、低秩表示LRR(Low-Rank Representation)、二值特征表示BR(Binary Representation)等。稀疏表示一般假设未知样本可以通过来自字典的几个训练样本的组合来近似表示,稀疏向量隐式地对类别信息进行编码。常见的稀疏表示形式有L1 范数正则化(Xing 等,2020)、拉普拉斯正则化(Chen等,2011)、组稀疏编码(Zhang 等,2013)、自适应稀疏编码(Fang 等,2017)、联合稀疏模型(Zhang 等,2014)等。低秩表示则是在低秩约束下找到高光谱图像数据的一种表示形式(Xing 等,2022),用于获取数据的全局结构信息。Chen等(2020)提出的低秩判别最小二乘回归模型LRDLSR(Low-Rank Discriminative Least Squares Regression)巧妙地利用低秩约束来挖掘结构特征。二值特征表示的主要思想是在二值0/1 空间中寻找高光谱图像的特征表示形式(Li 等,2022;Jia 等,2018;Xing 等,2023)。Xing等(2023)提出了一种基于局部光谱二值特征学习方法,首先对每个光谱向量进行分割,建立光谱向量的局部光谱模块,然后对这些局部光谱模块进行联合编码,构建具有局部光谱上下文注意力的二值特征编码模型,在分类任务中取得不错的效果。

深度学习是近些年最流行、最受关注的机器学习方法,能够对数据进行高效表征学习,可以挖掘和描述隐藏在数据背后的深层次信息。Chen等(2014)首次将深度学习引入高光谱图像分类任务中,利用堆栈式自动编码器来构建深度网络DAE(Deep AutoEncoder),获得图像的深层特征。受此启发,Chen等(2015)利用深度置信网络DBN(Deep Belief Networks)来感知高光谱图像的联合空间—光谱特征。针对传统的DBN 模型面临的特征判别性不高的问题,Li等(2022)则设计了一种基于多DBN(Multi-DBN)结构的学习网络,能够提取高光谱图像的深度流形特征。卷积神经网络CNN(Convolutional Neural Network)是最常见的深度学习结构,在高光谱图像特征提取与分类中,无需手动干预,提取特征的判别性也较高。Xu等(2018)将高光谱图像进行切块处理,并自动选取若干个图像块作为卷积核来构建卷积网络框架,可同时提取图像的浅层和深层特征,用于分类计算。Cao等(2020)将主动学习AL(Active Learning)和CNN 集成到统一框架中,以改善高光谱图像分类的性能。Dong等(2022)利用基于超像素的图神经网络GAT(Graph Attention Network)和基于像素的CNN 的互补特性,提出了GAT 和CNN 加权特征融合方法,并用于高光谱图像分类,也取得了不错的效果。此外,生成对抗神经网络GAN(Generative Adversarial Network)、Transformer 等新型深度学习方法也已经被用到高光谱图像分类问题中。例如,Bai等(2022)提出了一种复合型网络结构,将GAN、Transformer 以及卷积块统一起来,具有由Transformer 支持的全局感受野和由卷积块支持的局部感受野的特点,并在高光谱图像分类中取得了很好的结果。

高光谱图像分类大多可看作是由特征提取与基于分类器的标签预测这两阶段操作组成,并且它们在设计时往往是相互独立的。虽说深度学习方法常常是直接进行特征学习并进行分类(即是从数据输入到分类结果输出的端到端(end-toend)网络结构),但本质上仍可看作由基于DAE、CNN 等的特征提取方法与基于softmax、logistic regression 等的分类器直接级联而成。现有方法在构建特征提取模型时,一般不考虑分类器的影响,这可能会导致提取的特征并不兼容当前分类器,预测结果较差。这种不兼容性体现在分类器模型与其输入特征数据之间的匹配关系。众所周知,分类器往往都是基于一定模型的。当数据和模型匹配的时候,分类结果会很好。然而,当数据与模型不匹配的时候,分类结果一般会很差(Tan 和Wang,2007)。此外,图1 给出了一张示例图,用于进一步说明特征与分类器之间的不兼容及其对分类结果的影响,其中以高光谱图像中两地物中部分样本为例,且将像元直接作为特征,SVM 作为分类器。从图1中可以看出,上面虚线框中特征与SVM 分类器不够兼容匹配,使特征可能不易被分类器所处理,导致分类结果较差。下面虚线框中,在特征获取过程时加入SVM 特性,使得特征具有了“大间隔”的分布特点,这是SVM 分类器的内在要求,更容易被SVM 分类器所处理,从而实现较高的分类性能。基于以上分析,本文提出具有分类器机制的高光谱图像特征提取方法,实现特征提取与分类器间的兼容,使所提取特征能够更好地被分类器计算,改善分类预测结果。分类器机制是关于分类器的约束,即:本文将分类器进行定量描述,并作为高光谱图像特征提取模型的约束项。本文创新性贡献可归纳为如下3个方面:(1)提出了具有分类器机制的高光谱图像特征提取方法,在数学上明确方法的一般表达形式,定量分析了方法的基本原理和结构;(2)以稀疏表示与SVM 分类器为例,建立了基于SVM 特性的稀疏特征提取模型SRS(Sparse feature extraction with SVM),并给出其优化求解过程;(3)以深度自编码网络DAE 与softmax 分类器为例,建立了基于softmax 特性的深度自编码特征提取网络DAES(Deep Autoencoder feature Extraction with Softmax),并提出了相应的优化求解策略。

图1 特征与分类器之间不兼容及其对分类结果影响的示例图,其中以高光谱图像中两地物中部分样本为例Fig.1 An example diagram of the incompatibility between features and classifiers,and its impact on classification results,where samples from two objects in hyperspectral images are partly selected

2 本文方法

2.1 研究动机与模型建立

本质上,高光谱图像分类由两大部分组成,即特征提取与分类器预测,并且这两部分通常是相互独立的。一般来说,由于在构建特征提取模型时,并不考虑分类器的影响,因此提取的特征可能不适应分类器,导致预测结果较差。如果将分类器的特性集成到特征提取模型中,那么提取的特征与对应的分类器之间将变得更加匹配,对分类预测也是非常有意义的。因此,本文将关注特征提取与分类器之间的关系,旨在建立一种能够与分类器相兼容的特征提取模型。基于上述分析,本文建立的具有分类器机制的高光谱图像特征提取方法的一般形式如下:

式中,Z表示模型输出的特征;ψf(·)表示模型的特征提取部分;ψc(·)表示具有分类器特性的模型成分;Θf、Θc分别是ψf(·)与ψc(·)的参数集合;η是ψf(·)与ψc(·)的耦合参数。从式(1)中可以看出,所建立的特征提取方法将反映分类器机制的ψc(Z,Θc)作为特征提取模型ψf(A,Z,Θf)的约束项,使特征提取模型具备了分类器特性。通过实际的优化求解,使建立的模型在特征提取过程中充分考虑了分类器的作用,实现提取的特征与对应的分类器之间的兼容性。这种兼容性保证了特征能够满足分类器的内在要求,更易于被分类器处理,从而实现分类性能的提升,预测出更佳的分类结果。为了便于表示与分析,本文给出模型式(1)的两种具体形式:(1)以稀疏表示与支持向量机SVM 为例,构建基于SVM 特性的稀疏特征提取模型,记为SRS 形式;(2)以深度自编码网络与softmax 函数为例,建立基于softmax 特性的深度自编码特征提取网络,记为DAES形式。

2.2 基于SRS的特征提取方法

基于稀疏表示的特征提取方法,是寻找一个映射关系W,使得WA=Z,且Z尽可能的稀疏,其数学模型可表示为

式中,W∈RE×L;α为正则化参数。为了建立具有SVM 特性的稀疏特征提取模型,需要对SVM 进行定量描述,并作为约束嵌入到模型式(2)中。本质上,SVM 寻找已知不同类别样本间的最大间隔决策面。若样本分布未知,那么在一定的条件下,可获得某种具有大间隔的样本特征分布。考虑WA=Z,并根据SVM 理论,能够反映SVM 特性的数学形式可描述为

式中,Z可理解为未知样本的集合。进一步考虑松弛变量,式(3)可转化为如下形式:

式中,γ表示耦合参数,ξi,j为松弛变量。所以,将反映SVM 特性的式(4)作为约束项,嵌入到稀疏表示模型式(2)中,可得到具有SVM 特性的稀疏特征提取模型SRS,即:

式中,β表示耦合参数,为稀疏表示项,以及约束项表示SVM 分类器特性。该特征提取模型同时包含了稀疏特征表示与SVM 分类器的特点,因此特征不仅具有稀疏性,还容易被SVM 分类器处理计算。模型式(5)是一个多变量优化求解问题,也是一个非凸问题,所以无法直接获得其最优解。模型式(5)亦可看作单个变量(固定其他变量)的凸优化问题,所以本文设计了一种基于交替优化的求解策略,以获得模型的最优解。

2.2.1 优化变量W与ξ

固定模型式(5)中变量Z不变,得到仅关于变量W与ξ的优化模型:

引入Lagrange法(Parikh 和Boyd,2014),建立如下的Lagrange方程:

式中,εi,j表示参数变量,控制约束项的权重。考虑 KKT条件(Karush-Kuhn-Tucker conditions)(Wu等,2016),得到下面的式子:

根据式(8)—式(10),可直接给出W和ξ的最优形式。

2.2.2 优化变量Z

保持式(5)中变量W与ξ不变,获得关于Z的优化模型,即:

为求解模型式(11),这里引入辅助变量P=Z,使模型式(11)等价于:

式中,λ为常数。由ADMM(Alternating Direction Method of Multipliers)(Parikh和Boyd,2014)优化算法理论知,式(12)的最优解可通过如下两式交替迭代得到,即:

式中,soft(a,b)=sign(a)×max(|a|-b,0),sign(a)为符号函数。

经过式(8)—式(10)、式(13)—式(14),可以求出最优的变量W,即通过训练样本集合A学习到的映射矩阵W。对于未标注的测试样本集合B,其特征可表示为WB。具体的处理流程如算法1所示。进一步地,利用SVM 分类器对特征WB 进行计算处理,获得测试样本集合B的标签信息。算法1为

输出:映射关系矩阵W、高光谱图像B的特征WB。

2.3 基于DAES的特征提取方法

本文DAES 方法将深度自编码网络与softmax分类器函数集成在一起,用于提取高光谱。

图像特征,其形式可表示为

式中,Aj、Uj、Vj分别是自编码网络中第j层(1 ≤j≤J)的输入、解码矩阵以及编码矩阵,且Aj=以及A1=A;losssm为关于softmax分类器的损失函数;σj是第j层的稀疏正则化参数;δ为耦合常数。为简化分析,本文仅将网络顶层(即第J层)中嵌入分类器机制,那么模型式(15)可视为由J-1层的自编码网络与式(16)所级联而成的形式。

式 中,AJ∈、UJ∈RR×G、VJ∈RR×G(R和G分别是第J层输入与输出的维数)。模型(15)的前J-1 层的解Aj、Uj、Vj(1 ≤j≤J-1)可直接通过标准稀疏自编码网络训练获得,第J层的解UJ、VJ需优化求解模型式(16)。为便于求解,引入辅助变量S=那么模型式(16)等价于:

式中,κ为常数参数。下面,本文将给出模型式(17)的优化求解过程。

2.3.1 优化变量UJ

固定模型式(17)中的VJ、S不变,则有仅关于变量UJ的式子:

该式子的解析解可表示为

2.3.2 优化辅助变量S

当固定UJ、VJ不变时,模型式(17)可改写为

该式的最优解S可通过下式表示,即:

2.3.3 优化变量VJ

当保持变量UJ和S不变时,式(16)可写为如下仅关于变量VJ的形式,即:

该式等价于:

定义L(VJr)为式(22)的目标函数,其关于VJr的导数可表示为

根据梯度下降法,变量VJr可通过下式来更新,即:

式中,θ表示学习率,VJ=

2.3.4 DAES特征提取网络的训练策略

为了训练DAES 特征提取网络,本文提出一种两阶段训练策略。首先将网络提取的特征输入到softmax分类器中,建立基于DAES的高光谱图像分类方法。本文的两阶段训练策略如下:在第一阶段,利用带标签的训练样本集A来训练DAES 分类方法的前J-1 层与softmax 层,这样可看成是传统的深度自编码预测网络,可以学习前J-1 层的参数Aj、Uj、Vj(1 ≤j≤J-1);在第二阶段,单独训练第J层。首先将第一阶段训练的AJ-1作为第J层的数据输入,即AJ=AJ-1,然后根据式(19)、(21)、(25)等交替迭代,即可获得UJ、VJ。本文DAES算法的处理流程如算法2所示:

3 实验结果及分析

本节将对提出的SRS 和DAES 特征提取方法进行实验分析。根据前文分析,SRS 和DAES 方法中分别包含SVM 分类器特性和softmax 函数特性,为便于算法评估,本实验将SRS 和DAES 所提取的高光谱图像特征分别输入到SVM 分类器和softmax 分类器中,输出对应的分类结果,进一步地对所获分类结果进行分析评价。

3.1 实验数据与评价指标

本文选取遥感高光谱图像与医学高光谱图像来进行实验验证与分析。一方面,遥感高光谱图像采用Salinas 数据、Pavia Centre 数据以及Houston数据。Salinas 数据是由美国发射的卫星所搭载的AVIRIS(Airborne/Visible Infrared Imaging Spectrometer)传感器所采集的,拍摄的是美国加利福尼亚州Salinas 山谷照片,包含16 个类别,尺寸为224 × 512 × 217。为便于实验,剔除20 个吸水区域波段,并减少其空间尺寸至原来的一半,得到204 × 256 × 108大小的实验数据。Pavia Centre数据是由ROSIS(Reflective Optics System Imaging Spectrometer)传感器所采集,记录的是意大利帕维亚(Pavia)市中心的信息,包含9个类别。为便于实验,去除数据中噪声波段,并减小空间分辨率,得到尺寸为103 × 365 × 238 的实验数据。Houston数据是由NCALM(Airborne Laser Mapping)所采集,拍摄的是休斯顿大学校园及附近街区,其大小为144×349×1905,包含15个地物类别。另一方面,医学高光谱图像取自于In-Vivo HHB(In-Vivo Hyperspectral Human Brain)数据集,该数据集是由一台外科手术高光谱采集系统获得,描述的是手术过程中人脑的实时情况。成像相机覆盖400—1000 nm的光谱范围,光谱分辨率是2—3 nm,可捕获826 个光谱带。In-Vivo HHB 数据集共包括来自不同患者的36组高光谱图像组成,每组图像含4个类别(正常组织、肿瘤组织、血管以及背景等)。

在实验中,为了定量地评价算法的性能,本文使用了3个常用的评价指标来衡量不同方法分类结果的质量,其中包括总体准确度OA(Overall Accuracy)、平均准确度AA(Average Accuracy)以及Kappa 系数。总体准确度OA 用于计算正确分类的像素百分比。平均准确度AA 则是每个类别的平均像素百分比。Kappa系数是修正分类像素的正确百分比。在本实验中,所有列出的度量结果都是5次实验结果的平均值。

3.2 参数分析与选择

本文的SRS(包括α、β、γ)和DAES(包括σj、δ)方法包含了若干关键参数,其不同取值会影响方法的性能。因此,需要对这些参数进行实验分析,以便能选择出合适的取值。为简化实验,首先利用单个高光谱数据进行实验分析,选择出最佳取值,然后将这些最优值推广到其他数据集上。选取Salinas 高光谱图像作为参数分析与选择的实验数据,并利用OA、AA 以及Kappa 指标对结果进行评价。此外,参考网格搜索法(grid search),参数α、β、γ、σj、δ的取值范围均为[10-3,10-2,10-1,100,101,102]。

3.2.1 SRS方法的参数分析与选择

图2 是参数α、β、γ的不同取值对SRS 方法性能(在OA、AA 以及Kappa 指标上)的影响曲线。从图2中可以看出,当α=10-2、β=100、γ=10-2时,OA 指标的值均取到最大,即此时SRS 的性能最优。当α<10-2、β<100、γ<10-2时,OA、AA 以及Kappa的值均趋于减小。原因在于,随着SRS提取模型式(5)中稀疏项和SVM 分类器项的权重降低,该模型的特征表示能力会削弱,并且所提取的特征与SVM 分类器之间的兼容性也会减弱。相反地,当α>10-2、β>100、γ>10-2时,OA、AA以及Kappa 的值也明显减小,这是因为,随着模型式(5)中稀疏项或SVM 分类器项的权重提高,输入图像与输出特征间的一致性(即:‖WA-会大大减弱,导致输出的特征失真严重。综上分析,SRS 方法中参数α、β、γ分别取10-2、100、10-2为最优选择值。

图2 参数α、β、γ的不同取值对SRS方法性能的影响曲线Fig.2 The performance of the SRS method with different values of parameter α,β,and γ

3.2.2 DAES方法的参数分析与选择

本文DAES 方法的重要参数包括各层稀疏正则化参数σj、softmax 损失函数项的权重δ以及网络层数J。

首先,为便于分析,将网络各层的稀疏正则化参数σj设置为同样的值,表示为σ=σj(1 ≤j≤J),并设置网络层数为4层(即J=4)。如图3 所示为参数σ、δ的不同取值对DAES 方法性能(在OA、AA以及Kappa指标上)的影响曲线。从图3中可以观察到,当σ=10-2、δ=10-1时,DAES 方法性能(在OA、AA 以及Kappa 指标上)均达到最优。当σ<10-2、δ<10-1时,DAES 性能趋于降低,这是由于DAES模型式(15)的稀疏性和softmax函数特性降低所导致的。而当σ>10-2、δ>10-1时,DAES 性能出现大幅度衰减,这是因为过高的稀疏项和softmax 函数项权重严重影响了自编码网络的特征表示能力。因此,选择σ=10-2、δ=10-1作为参数的最优值。

图3 参数σ、δ的不同取值对DAES方法性能的影响曲线Fig.3 The performance of the DAES method with different values of parameter σ and δ

其次,根据上述参数分析结果,设置σ=10-2、δ=10-1。如图4 所示为网络层数J的不同取值对DAES方法性能(在OA、AA以及Kappa指标上)的影响曲线。从图4 中可以看到,当J<4 时,DAES方法的性能趋于下降,这是因为深度特征感知不足而导致的。当J≥4时,DAES方法的性能达到最优,并趋于稳定。考虑到过多的网络层数会降低计算效率,因此选择J=4作为网络层数的最优值。

图4 网络层数J的不同取值对DAES方法性能(在OA、AA以及Kappa指标上)的影响曲线Fig.4 The performance(in OA,AA,and Kappa)of the DAES method with different values of parameter J

3.3 算法对比

本实验采用遥感高光谱图像和医学高光谱图像数据来进行算法对比,以验证本文SRS和DAES方法的有效性和优越性。本文SRS和DAES方法所包含的关键参数,其值按照前文参数分析实验结果来选择,即α=10-2、β=100、γ=10-2、σ=10-2、δ=10-1。

3.3.1 在遥感高光谱图像上算法对比结果

将Salinas、Pavia Centre、Houston 数据作为实验数据,验证本文SRS和DAES算法在遥感高光谱图像上的有效性和优越性。选取6个先进算法用于对比,包括RAW(He等,2016)、EMAP(Benediktsson等,2005)、LRDLSR(Chen 等,2020)、MFASR(Fang 等,2017)、RPNet(Xu 等,2018)、SMBN(Fang 等,2019)。RAW 算法是将高光谱图像的像素向量看作特征,并用SVM 分类器预测分类结果;EMAP 算法建立了具有前3 个主成分的形态轮廓来提取特征,同时也利用SVM 分类器进行结果预测;LRDLSR 算法是低秩判别最小二乘回归模型,利用低秩约束来挖掘结构特征;MFASR 方法是一种多特征策略,融合了光谱像素、形态轮廓特征、Gabor 纹理特征、微分形态轮廓等4 组特征来联合预测高光谱图像的标签;RPNet算法是一种深度卷积神经网络,生成的特征同时包含图像的浅层和深层特性,并利用SVM 做分类计算;SMBN 算法是一种多偏置深度网络结构,根据不同物体偏差的大小,将特征图分解成多个响应图(对应不同的地面物体),并利用softmax做分类结果预测。上述6个算法的参数值,均按照对应文献所建议的方式来设置。此外,随机选择高光谱图像数据的每个类别中像素数量的10% 用作训练样本,剩余90%作为测试样本。

图5、图6、图7 是不同方法在Salinas、Pavia Centre 和Houston 数据上的分类结果。从图中可以看出,本文SRS 和DAES 方法的分类结果图(即图5(i)—(j)、图6(i)—(j)、图7(i)—(j))比其他算法的结果(即图5(c)—(h)、图6(c)—(h)、图7(c)—(h)更接近于groundtruth图(即图5(b)、图6(b)、图7(b)),说明了SRS 和DAES 方法的结果更好。例如,在图5 中,对比算法RAW、EMAP、LRDLSR、MFASR、RPNet、SMBN 的分类结果图在“未开垦的葡萄园”区域上包含较大面积的分类错误,但是本文SRS 和DAES 算法在该区域上的错误有明显的减少。在图6中,白色虚线框标注的“草地”、“瓷砖”等区域在6个对比算法的结果中都有较为明显的误分类情况,而这些不足在本文方法的结果中都得到显著的改善。图7所展示的结果图也进一步表明了本文方法取得了更好的分类图。上述实验现象说明,本文SRS 方法和DAES 方法取得的分类结果图整体上是优于其他对比算法的分类图,主要原因这两种方法中具有分类器约束,使提取的特征与其所用分类器之间具有良好的兼容性,这也是本文方法在特征层面的优势。此外,本文还列举了不同方法在Salinas、Pavia Centre、Houston 数据上的评价指标结果,如表1、表2 以及表3 所示。从表1—3 中可以看出,本文SRS 和DAES 方法的OA、AA 以及Kappa 指标值大多是高于对比算法的指标值(除Pavia Centre数据上的AA指标以外)。

表1 不同分类算法在Salinas数据上的评价指标结果Table 1 Metric results of different methods on Salinas/%

表2 不同分类算法在Pavia Centre数据上的评价指标结果Table 2 Metric results of different methods on Pavia Centre/%

表3 不同分类算法在Houston数据上的评价指标结果Table 3 Metric results of different methods on Houston/%

图5 不同方法在Salinas图像上的分类结果图对比Fig.5 Classification maps of different methods on Salinas

图6 不同方法在Pavia Centre图像上的分类结果图对比Fig.6 Classification maps of different methods on Pavia Centre

图7 不同方法在Houston图像上的分类结果图对比Fig.7 Classification maps of different methods on Houston

根据上述在遥感高光谱图像上的对比结果可以看出,相比于对比算法,本文SRS和DAES方法取得更好的分类性能,这是因为本文方法充分考虑了特征提取与分类器之间的关系,保证了特征提取与分类器之间的兼容性,使特征更易于被分类器所处理。

3.3.2 在医学高光谱图像上算法对比结果

在生物医学领域,基于高光谱图像的疾病诊断技术是一种新兴技术,具有广泛的应用前景(高红民 等,2023;李伟 等,2021)。不同病理组织的化学组成和物理特征具有不同的反射和吸收特性,表现为光谱曲线的差异性,实现组织状态信息的定性或定量检测。根据高光谱图像呈现出的空间分布信息,实现组织不同病态的可视化,从而为诊断组织疾病提供数据支持。为开展算法在疾病诊断方面的应用研究,这里将In-Vivo HHB数据集作为实验数据,探讨本文SRS 和DAES 算法在医学高光谱图像上的性能表现。

Wei等(2019)将RAW(He等,2016)、SVMGabor(Li和Du,2014)、CNN(Hu等,2015)成功应用于高光谱图像的细胞分类、肿瘤诊断。MFSAR(Fang等,2017)、DAE(Chen等,2014)、RPNet(Xu 等,2018)算法也在医学高光谱图像分类任务中取得不错的效果。因此,本文将这6种算法作为对比算法,以验证SRS 和DAES 算法在医学高光谱图像上的有效性和优越性。类似地,随机选择高光谱图像数据的每个类别中像素数量的10%用作训练样本,剩余90%作为测试样本。

图8 和图9 为不同方法在In-Vivo HHB 数据集中MedHSI No.015-01 和MedHSI No.020-01 图 像上的分类结果图。从图8中可以看出,本文SRS算法的分类图(图8(j))优于RAW、SVM-Gabor、MFASR、SAE、CNN的分类图(图8(c)—(h)),但劣于RPNet 的结果图(图8(i)),这是因为RPNet同时获取数据的深层和浅层特征,具有很强的特征表征能力。然而本文DAES 方法作为一种深度学习方法,其提取的特征与分类器具有很强的兼容性,因此它的分类图(图8(j))都优于所有对比算法的结果图(图8(c)—(i))。此外,在图9 中,本文SRS 和DAES 算法的结果(图9(j))均明显好于对比算法的结果图(图9(c)—(i))。表4 和表5 列举的评价指标结果与以上分类图结果一致。综上,可以得出,本文SRS 和DAES 算法在医学高光谱图像分类任务中具有明显的有效性和优越性。

表4 不同分类算法在MedHSI No.015-01数据上的评价指标结果Table 4 Metric results of different methods on MedHSI No.015-01/%

表5 不同分类算法在MedHSI No.020-01数据上的评价指标结果Table 5 Metric results of different methods on MedHSI No.020-01/%

图8 不同方法在MedHSI No.015-01图像上的分类结果图对比Fig.8 Classification maps of different methods on MedHSI No.015-01

图9 不同方法在MedHSI No.020-01图像上的分类结果图对比Fig.9 Classification maps of different methods on MedHSI No.020-01

3.4 消融实验

本文最突出的创新贡献是关注特征提取与分类器之间的关系,建立了能够与分类器相兼容的特征提取模型,使提取的特征能够更容易被分类器处理,从而改善分类的预测结果。为了进一步验证本文算法的有效性,本节开展关于SRS和DAES的消融实验,探索和证明集成的分类器特性在特征提取模型中的重要性。本实验中,SRS 和DAES方法中各参数按前文参数分析结果来设置,即α=10-2、β=100、γ=10-2、σ=10-2、δ=10-1。此外,以Salinas 高光谱图像作为实验数据,OA、AA 以及Kappa 为评价指标,观测对比本文SRS 和DAES算法在集成分类器特性前后的分类结果,如图10所示。从图10 中可以看出,SRS_NC 和DAES_NC取得的OA、AA、Kappa 指标值明显小于SRS 和DAES 的值。也就是说,当去除特征提取模型(5)和(15)中的分类器特性时,本文SRS 和DAES 算法的性能会出现较大幅度的降低,这是因为特征提取和分类器之间的兼容性不足而导致的。综上所述,本文构建的与分类器相兼容的特征提取模型在改善特征表征和分类预测方面具有明显的有效性。

图10 本文SRS和DAES算法在集成分类器特征前后的预测结果对比Fig.10 Result comparison of the proposed SRS and DAES method with/without embedded classifiers

3.5 收敛性分析

对于建立的SRS模型式(5)和DAES 模型式(15),本文给出了其对应的优化求解策略与过程。为进一步了解本文算法的可靠性与快速性,本文从收敛性方面分析探讨SRS 和DAES 的性能表现。以Salinas 高光谱图像作为实验数据,观测SRS 模型和DAES 模型的损失函数到达收敛时所消耗的优化迭代次数,其观测曲线如图11 所示。从图11 中可以看出,本文SRS 和DAES 模型均在50 次迭代内均可收敛,并达到最小值,这证明了本文给出的优化求解策略能够满足算法可靠性与快速性的应用要求。

图11 本文SRS和DAES模型的损失函数随迭代次数变化曲线Fig.11 Curves of loss functions of SRS and DAES models with iteration times

3.6 适用性讨论

从数据层面来说,影响本文方法性能的因素(即方法的适用性),主要体现在两大方面:波段数和空间分辨率。具体地,(1)高光谱图像的波段数,也称光谱分辨率,直接影响基于SRS 和DAES 特征提取的高光谱图像分类方法的效果。当波段数太小时,即光谱分辨率不足,高光谱图像光谱特性较弱,导致SRS 和DAES 提取的特征判别性不够,从而降低了分类精度。当波段数过度增加时,不仅会严重降低SRS 和DAES 方法的计算效率,而且波段间冗余信息会大量增加,进一步影响SRS 和DAES 的特征输出,影响分类结果。(2)空间分辨率也是影响SRS 和DAES 方法性能的一大因素。当空间分辨率太低时,图像中的细节信息往往比较模糊,且存在大量混合像元,空间特征较为贫乏,严重影响SRS 和DAES 输出特征的判别性和可分性,进一步影响分类性能。当空间分辨率过大时,不仅会降低方法的计算效率,而且还会限制高光谱图像的光谱分辨率,严重影响SRS 和DAES 的结果。综上,充分考虑高光谱图像数据的波段数与空间分辨率,能够让本文SRS 和DAES 方法实现更高水平的性能。

4 结论

本文关注特征提取与分类器之间的关系,提出了基于集成分类器机制的高光谱图像特征提取方法,实现特征提取与分类器间的兼容性,使所提取特征能够更好地被分类器计算,改善分类预测结果。本文给出了两种具体形式:(1)以稀疏表示和支持向量机为例,将SVM 分类器特性集成到稀疏表示形式中,建立能够与SVM 分类器相兼容的SRS 特征提取模型。(2)以深度自编码网络与softmax 函数为例,将softmax 分类器特性嵌入到深度自编码网络中,构建能与softmax 分类器相兼容的DAES特征提取模型。此外,本文也给出了所构建SRS 和DAES 模型的求解策略与优化过程。在实验中,本文从参数分析、算法对比、消融实验、收敛性分析等方面对SRS 和DAES 算法的有效性和优越性进行了全面地分析验证。本文为高光谱图像特征提取与分类提供了新思路,也为遥感监测、医学诊断等应用提供了方法学支持。

猜你喜欢
特征提取分类器光谱
基于三维Saab变换的高光谱图像压缩方法
基于Daubechies(dbN)的飞行器音频特征提取
BP-GA光照分类器在车道线识别中的应用
Bagging RCSP脑电特征提取算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
星载近红外高光谱CO2遥感进展
基于MED和循环域解调的多故障特征提取
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
苦味酸与牛血清蛋白相互作用的光谱研究