一种基于深度学习的多基线InSAR高程反演方法

2024-05-14 14:02周宇翀谢先明
广西科技大学学报 2024年2期
关键词:聚类分析深度学习

周宇翀 谢先明

摘 要:提出一种深度学习与聚类分析算法结合的多基线合成孔径雷达干涉(interferometric synthetic aperture radar, InSAR)高程反演方法。该方法利用深度学习神经网络对干涉图截距信息进行分类,作为干涉像元类别属性判断的依据,精确获取干涉像元聚类中心,在此基础上利用聚类分析算法获得观测场景的高程信息。主要步骤如下:首先,获取干涉图截距信息,随后利用深度学习神经网络对干涉图截距信息进行分类,获得干涉像元类别属性。其次,对网络预测的同一类别像元截距取其平均作为该类别像元的聚类中心,有效避免传统算法因对噪声敏感造成的错误分类。最后,利用聚类分析算法对网络预测聚类中心进行后处理得到观测场景高程信息。模拟和实测实验数据表明,在不同信噪比的情况下,该方法对不同地形高程反演的均方根误差比传统CA算法更小,重建精度更高。

关键词:多基线InSAR;深度学习;聚类分析

中图分类号:P224;V448.2 DOI:10.16375/j.cnki.cn45-1395/t.2024.02.009

0 引言

合成孔径雷达干涉(interferometric synthetic aperture radar, InSAR)是一种可以高精度获取目标地形三维信息的技术[1-2]。传统的单基线InSAR相位展開技术需要符合相位连续条件[3-5],因此,多基线InSAR高程反演技术在单基线InSAR的基础上孕育而生,可以利用多条基线信息来克服相位不连续条件,高效精准地解决地形突变问题。

近几十年基于不同策略的多基线InSAR高程反演方法相继提出,包括以统计思想为代表的最大似然估计(ML)算法[6]、最大后验(MAP)算法[7]、基于全变分的MAP算法[8],这类算法利用概率密度函数构建高程反演模型,但高程反演结果对干涉图的环境要求较高,同时也受限于基线数量。以非统计思想为代表的有中国余数定理(CRT)算法[9]、TSPA算法[10]、聚类分析(CA)算法[11]等。其中,CRT算法要求干涉图基线条件满足两两互质,并且在纯净环境下才能准确无误获取高程解。TSPA算法是在CRT基础上获取全局梯度信息,再结合单基线相位解缠框架来提高噪声鲁棒性。CA算法是根据多幅干涉图的截距信息将像素分成不同的类别,再由每个类别的聚类中心点来反演每个类的高程信息,该方法虽然有很高的运行效率但极易受到噪声影响,对噪声变化极为敏感。为此,文献[12]对CA算法做出改进,给出了新的闭式求解公式以及新的滤波方式,进一步提高高程反演的精度与效率。文献[13]采用匹配三维滤波算法(BM3D)选为图像滤波的方法,分别对干涉图、截距图、聚类图以及相位展开图定义不同的度量标准,来应对不同滤波对象的特征信息,该算法拥有先进的去噪性能,同时能保留原始图像相对完整的像元信息,极大提高高程反演能力。此外,以非线性卡尔曼滤波器为代表[14]的多基线相位解缠算法在高程反演中有着较强的鲁棒性。随着深度学习技术不断创新发展[15-16],该项技术已成功运用到相位解缠等领域。文献[17]把相位解缠问题转为语义分割问题,利用SegNet网络间接解缠相位。文献[18]利用BCNet网络构建残差点与枝切线之间非线性映射关系,再优化枝切线,最后使用传统枝切法获取解缠相位。文献[19] 把DL引入多基线InSAR高程反演中,利用网络获取CA算法的全局梯度信息,与TSPA算法进一步结合,更好地实现高程反演精度。

本文提出一种深度学习与CA算法结合的多基线InSAR高程反演方法(CFAMNetCA)(见图1)。该方法首先获取干涉图截距信息,随后利用CFAMNet[20]对干涉图截距信息进行分类,获取干涉像元的类别属性。CFAMNet利用类注意力机制增强模块类之间的相关性来提升网络预测的准确性,可以有效避免传统CA算法因对噪声敏感导致的像元错误分类现象。其次,对网络预测的同一类别像元的截距信息取其平均作为该类别像元的聚类中心,有效避免传统算法因对噪声敏感造成的错误分类。最后,利用传统CA方法对网络预测聚类中心进行后处理,得到观测场景高程信息。实验结果表明,该方法能获得比传统CA方法更稳健的结果。

1 CA算法

在多基线InSAR系统中,同一地区可由不同基线[Bi]获取多幅干涉图。其中缠绕相位[φi(-π≤φi≤π)]、真实相位[?i]以及高程值[hi]之间的关系可以表示为

式中:[ki]为像元的相位模糊数(为整数);[hi]表示目标地形所对应的高程值;[κ]表示真实相位与高程值之间的转换因子;[λ]表示雷达工作波长;[R0]表示主天线到目标地面的距离;[θ]为主天线的视角;[Bi⊥]为垂直基线长度,为方便计算,[Bi⊥]可近似为[Bi]。

从式(4)可以看出,某一个像元的相位模糊数向量[(k1,k2)]可以视为线性方程上的整数点,其中斜率和截距都是已知的。由此可以得到结论:在无噪声的环境下,同一类的像元所构成的直线都是重合的,因此截距的类别就是具有相同相位模糊数的像元类别。在[k1][-][k2]平面内搜索每个像元对应直线的整数对[(k1, k2)]就可以准确反演出高程信息。实际上在有噪声的情况下,缠绕相位[φ1、φ2]都会被影响,但根据式(4)可看出影响的只是截距部分,因此会导致原本属于同一类重合的直线会出现上下偏移的现象。虽然会出现偏移,但仍存在某一直线处有聚类现象。所以聚类分析就是找出一个类的中心线并将其视为无噪声的聚类中心,通过搜寻方法找出满足条件的相位模糊数,最后反演高程信息。

2 基于深度学习的干涉图分类网络

2.1 CFAMNet网络

CFAMNet结构如图2所示,由网络编码器和解码器组成,以deeplabv3+网络结构为骨架,采用多平行空间金字塔池化MASPP(如图3所示),融合类特征注意力模块CFAM(如图4所示),编码器采用ResNet50进行特征提取,其结构如图5所示。首先通过卷积核为7*7的卷积和一个3*3的最大池化将原始特征压缩为原来的1/4;然后通过4个残差块依次进行输出,其中前3个残差块通过调整步长将特征图尺寸依次压缩为原来的1/2,第4个残差块通过融合空洞卷积率为2的空洞卷积来保持特征图大小不变。每个残差块由多个残差结构组成。残差结构如图6所示,它包含2个卷积核为1*1的卷积和一个卷积核为3*3的卷积。残差结构的引入可有效防止网络层所造成的梯度爆炸问题,在残差块4之后连接MASPP模块,并在残差块3和残差块4之后添加CFAM,这些模块获得的特征图可用于提取关于类别和空间上下文的更详细信息。解码器在对编码器获得的特征图进行4次上采样后,与残差块1和残差块2获得的特征地图进行特征融合,并执行卷积核为3*3的卷积操作,最后进行4次下采样来恢复原始图像大小。

CFAMNet将MASPP和CFAM模块集成在底层特征中,并将MASPP模块提取的多尺度信息与CFAM模块提取的类特征信息相结合,以更好地提取底层细节。此外,编码器-解码器结构的采用有助于恢复从基础层提取的信息。

2.2 网络数据集

当前没有公布明确的对多基线InSAR高程反演的数据集,故本实验参照文献[17],构建连续和不连续两类数据集。网络训练过程中,把噪声截距图(256×256)作为网络输入,其对应的纯净聚类信息图(256×256)作为对应标签,构建1组数据。本文网络数据集由27 000组数据构成,具体构建方式如下。

2.2.1 连续地形数据集

1)按照文献[17]描述方法随机生成真实高程图,图像尺寸为256×256,高程范围0~180 m,如图7(a)所示;随后生成干涉图以及截距信息图,见图7(b)—(d);在纯净环境中由传统CA算法根据截距求出聚类信息作为标签,见图7(e)。将添加噪声的截距图与纯净的聚类信息一一对应构建1组数据,共随机生成5 500组。值得提及的是论文中所有高程图、干涉图以及截距信息图、聚类信息图以及重建高程误差图,横坐标单位为距离向/像素,左侧纵坐标单位为方位向/像素。其中高程图右侧颜色標单位为m,干涉图右侧颜色标单位为弧度,截距信息图以及聚类信息图右侧颜色标为无量纲。高程误差直方图横坐标表征重建高程误差(单位为m),左侧纵坐标单位为像素。

2)将我国某城部分高程图转换为实验所需高程图,如图8(a)所示,随后生成干涉图、截距图和聚类信息图,见图8(b)—(e)。共随机生成6 000组。

2.2.2 不连续地形数据集

1)通过对连续地形部分区域置0或重新赋值的方式来获得不连续地形高程图,图像尺寸为256×256,高程范围0~180 m,如图9(a)所示;随后生成干涉图、截距图和聚类信息图,见图9(b)—(e)。共随机生成5 500组。

2)模拟城市地形高程图,图像尺寸为256×256,高程范围0~180 m(见图10(a));随后生成干涉图、截距图和聚类信息图,见图10(b)—(e)。共随机生成10 000组。

综上,连续与不连续突变地形随机数据集共生成27 000组,用来训练CFAMNet网络。

2.3 网络训练以及计算机配置

网络训练采用自适应矩估计优化器,把均方误差作为损失函数(MSE),其定义如下,

式中:EMS为MSE值;[yi]为预测值;[yi]为真实值;[n]为图像像元的数目。

在本文中,初始学习速率为0.001,模型的训练次数为200轮,早停的训练轮数为150轮,最小训练批次为8,训练时间约为25 h。学习率的下降方式为当验证集的损失函数处于5轮没有下降,学习率以衰减率为0.5的方式进行减少,当验证集的损失函数训练20轮一直没有下降时意味着模型基本训练完毕,可以早停,终止训练。计算机的软硬件配置参数见表1。

3 实验结果分析

本实验采用两基线仿真,与传统两基线CA算法比较。为验证CFAMNetCA算法的可行性与有效性,使用归一化均方根误差(NRMSE)作为评价标准,计算公式如下,

式中:ENRMS是NRMSE值;[h]是由算法反演的高程值;[h]是真实的高程值;[M、N]分别表示干涉图方位向和距离向的像元个数;([m, n])表示像元的坐标。实验所使用的InSAR系统的基本参数见表2。

3.1 城市地形高程反演实验

图11(a)为模拟城市A二维高程图,图11(b)—(d)为对应表2所示系统参数的含噪干涉图和截距图,大小为256×256。图12(a)为模拟城市B二维高程图,图12(b)—(d)为对应表2所示系统参数的含噪干涉图和截距图,图片大小为150×250(由于制作图片大小与网络输入图片尺寸不匹配,故先对图片用零填充方式扩展至网络输入图片尺寸大小后再进行网络预测,随后对预测结果进行裁剪还原至原尺寸,即可得干涉图聚类信息图)。上述干涉图信噪比(SNR)约为8.05 dB,对这2组干涉图进行高程反演,结果如图13—图14所示。

图13(a)—(c)为传统CA算法重建模拟城市A高程图、高程估计误差以及其误差直方图,图13(d)为本文CFAMNet网络预测得到的模拟城市A聚类信息图,图13(e)—(g)为本文方法重建高程图、高程估计误差以及其误差直方图。图14(a)—(c)为传统CA算法重建模拟城市B高程图、高程估计误差以及其误差直方图,图14(d)为本文CFAMNet网络预测得到的模拟城市B聚类信息图,图14(e)—(g)为本文方法重建高程图、高程估计误差以及其误差直方图。从图13—图14所示的高程反演结果可以看出,传统CA算法与本文方法都能恢复地形的原始地貌,不同的是传统CA算法在低信噪比情况下易受噪声影响,引起错误分类,导致聚类中心偏移,其高程重建精度降低,在其高程重建图中出现了较多的噪声“毛刺点”。相比于传统CA算法,本文方法利用网络预测得到的聚类信息不易被噪声影响,极大降低了产生错误分类的概率,其高程重建图中噪声“毛刺点”明显少于传统CA算法,从其误差直方图来看,本文方法误差更集中于0附近。表3列出不同信噪比情况下2种算法的均方根误差对比(实验10次,取平均值),可以看出本文方法高程重建精度更高。

3.2 不连续山地高程反演

为进一步验证算法性能,使用真实的Long's Peaks和Isolation Peaks国家公园实测数据进行验证。图15(a)为Long's Peaks二维高程图,图像大小为458×152,图15(b)—(d)为根据表2所示系统参数生成的含噪干涉图和截距图,图中信噪比约为11.9 dB。图16(a)为Isolation Peaks二维高程图,图像大小为458×157,图16(b)—(d)为根据表2所示系统参数生成的含噪干涉图和截距图,图中信噪比约为11.9 dB。上述2幅地形右侧均有明显突变,并且由于输入的图片不匹配网络输入图片尺寸,所以对图片先用零扩展至合适尺寸,再分割图片至适合网络输入图片尺寸进行预测,最后对分割图片预测结果进行合并处理即可得干涉图聚类信息图。

图17(a)—(c)为传统CA算法重建高程图、高程估计误差以及其误差直方图,图17(d)为CFAMNet网络预测Long's Peaks聚类信息图,图17(e)—(g)为本文方法重建高程图、高程估计误差以及其誤差直方图。图18(a)—(c)为传统CA算法重建高程图、高程估计误差以及其误差直方图,图18(d)为CFAMNet网络预测Isolation Peaks聚类信息图,图18(e)—(g)为本文方法重建高程图、高程估计误差以及其误差直方图。

从图17(a)和图18(a)可以看出,传统CA算法在上述高程重建图中存在较多散漫噪声,尤其是在较大噪声情况下影响更为显著,会导致较大误差,见图17(b)和图18(b);本文方法经过网络预测得到的聚类信息虽然在突变处尚未达到最优预测解,但是整体上对地形分类较为准确,相对于传统CA算法能较为完好地反演出不连续山地的高程信息,其高程重建图中散漫噪声较少,其误差更集中于0附近,表明本文方法反演结果更接近真实高程图,见图17(d)—(g)和图18(d)—(g)。表4列出不同信噪比下2种算法的均方根误差对比,可以看出本文算法高程重建精度更高。

4 结论

本文算法把深度学习神经网络与CA算法相结合,利用CFAMNet来获取干涉图、聚类信息图,可以有效避免传统CA算法因对噪声敏感导致的错误分类现象,从而改善高程重建精度。模拟城市与实测山地高程重建实验结果表明:与传统CA算法相比,本文方法的均方根误差较小,解缠精度较高,能更有效地解决不连续地形的高程重建问题。

参考文献

[1] XU H P,LI S,YOU Y N,et al.Unwrapped phase estimation via normalized probability density function for multibaseline InSAR[J]. IEEE Access,2019,7:4979-4988.

[2] YU H W,LAN Y,YUAN Z H,et al.Phase unwrapping in InSAR:a review[J]. IEEE Geoscience and Remote Sensing Magazine,2019,7(1):40-58.

[3] GOLDSTEIN R M,ZEBKER H A,WERNER C L.Satellite radar interferometry:two-dimensional phase unwrapping[J].Radio Science,1988,23(4):713-720.

[4] ASUNDI A,ZHOU W S. Fast phase-unwrapping algorithm based on a gray-scale mask and flood fill[J]. Applied Optics,1998,37(23):5416-5420.

[5] GHIGLIA D C,ROMERO L A. Robust two-dimensional weighted and unweighted phase unwrapping that uses fast transforms and iterative methods[J]. Journal of the Optical Society of America A,1994,11(1):107-117.

[6] PASCAZIO V,SCHIRINZI G. Multifrequency InSAR height reconstruction through maximum likelihood estimation of local planes parameters[J]. IEEE Transactions on Image Processing,2002,11(12):1478-1489.

[7] FERRAIUOLO G,PASCAZIO V,SCHIRINZI G. Maximum a posteriori estimation of height profiles in InSAR imaging[J]. IEEE Geoscience and Remote Sensing Letters,2004,1(2):66-70.

[8] FERRAIOLI G,SHABOU A,TUPIN F,et al. Multichannel phase unwrapping with graph cuts[J]. IEEE Geoscience and Remote Sensing Letters,2009,6(3):562-566.

[9] 张红敏,靳国旺,徐青,等. 中国余数定理在双基线InSAR相位解缠中的应用[J].测绘学报,2011,40(6):770-777.

[10] YU H W,LAN Y.Robust two-dimensional phase unwrapping for multibaseline SAR interferograms:a two-stage programming approach[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(9):5217-5225.

[11] YU H W,LI Z F,BAO Z.A cluster-analysis-based efficient multibaseline phase-unwrapping algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing,2011,49(1): 478-487.

[12] YUAN Z H,LU Z,CHEN L F,et al.A closed-form robust cluster-analysis-based multibaseline InSAR phase unwrapping and filtering algorithm with optimal baseline combination analysis[J]. IEEE Transactions on Geoscience and Remote Sensing,2020,58(6):4251-4262.

[13] YUAN Z H,CHEN T J,XING X M,et al.BM3D denoising for a cluster-analysis-based multibaseline InSAR phase-unwrapping method[J]. Remote Sensing,2022,14(8):1836.

[14] 宋明辉,谢先明,徐有邈,等.无味卡尔曼滤波的多基线InSAR高程重建方法[J].测绘科学,2021,46(6):115-122,146.

[15] 林川,曹以隽.基于深度学习的轮廓检测算法:综述[J].广西科技大学学报,2019,30(2):1-12.

[16] 乔亚坤,林川,张贞光.基于深度学习的轮廓检测模型的交互式解码网络[J].广西科技大学学报,2022,33(1):46-53.

[17] ZHANG J C,TIAN X B,SHAO J B,et al.Phase unwrapping in optical metrology via denoised and convolutional segmentation networks[J]. Optics Express,2019,27(10):14903-14912.

[18] ZHOU L F,YU H W,LAN Y.Deep convolutional neural network-based robust phase gradient estimation for two-dimensional phase unwrapping using SAR interferograms[J]. IEEE Transactions on Geoscience and Remote Sensing,2020,58(7):4653-4665.

[19] ZHOU L F,YU H W,LAN Y,et al.CANet:an unsupervised deep convolutional neural network for efficient cluster-analysis-based multibaseline InSAR phase unwrapping[J]. IEEE Transactions on Geoscience and Remote Sensing,2022,60:1-15.

[20] WANG Z M,WANG J S,YANG K,et al.Semantic segmentation of high-resolution remote sensing images based on a class feature attention mechanism fused with Deeplabv3+[J]. Computers & Geosciences,2022,158:104969.

A multi-baseline InSAR elevation reconstruction method based on deep learning

ZHOU Yuchong1, XIE Xianming*2

(1. School of Automation, Guangxi University of Science and Technology, Liuzhou 545616, China;

2. School of Electronic Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China)

Abstract: A multi-baseline interferometric synthetic aperture radar(InSAR)elevation reconstruction method based on deep learning and cluster analysis is proposed. This method uses deep learning neural network to classify the intercept information of the interferogram as the basis for judging the category attributes of the pixels, and accurately obtains the clustering center of the pixels, and then cluster analysis technique is used to obtain the elevation information of the observed scenes. The main steps are as follows: firstly, the intercept information of interferograms is obtained, and then the deep learning neural network is used to classify the intercept information of the interferograms. Secondly, the intercepts of the pixels classified into the same category predicted by the network are averaged as the clustering center of this category, which effectively avoids the misclassification caused by the traditional technique due to poor noise robustness. Finally, the cluster analysis technique is used to obtain the elevation information of the observed scenes. The simulation and measured experiment results show that the root-mean-square error of the proposed method is smaller and the reconstruction accuracy is higher than that of the traditional CA algorithm under different SNR.

Keywords: multi-baseline InSAR; deep learning; cluster analysis

(責任编辑:黎 娅)

收稿日期:2023-03-07;修回日期:2023-03-23

基金项目:国家自然科学基金项目(62161003,41661092);广西自然科学基金项目(2018GXNSFAA281196)资助

第一作者:周宇翀,在读硕士研究生

*通信作者:谢先明,博士,研究员,研究方向:InSAR技术以及多基线InSAR技术应用研究,E-mail:xxmxgm@163.com

猜你喜欢
聚类分析深度学习
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
新媒体用户行为模式分析
农村居民家庭人均生活消费支出分析
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究