基于卷积神经网络预测南海海底地形

2024-02-03 02:59王怀兵万晓云RichardFiifiAnnan
大地测量与地球动力学 2024年3期
关键词:水深重力反演

王怀兵 万晓云 Richard Fiifi Annan

1 中国地质大学(北京)土地科学技术学院,北京市学院路29号,100083

海底地形测量作为海洋测绘的一项重要内容,对科学研究、资源探索、军事战略以及经济建设都具有重要作用[1]。海底地形模型的构建一方面可以为船舶航道和航行安全提供保障,另一方面可以为深海探测以及航行提供基础资料[2]。传统的水深测量是利用船载回声探测技术,这种技术虽然精度高,但价格昂贵、费力、费时[3]。卫星测高技术使得利用卫星重力数据获取海底地形成为可能,尤其随着重力反演理论的不断成熟,利用卫星测高资料获取海底地形成为一种新型技术[4]。该技术可极大弥补传统测量方法的不足,具有空间覆盖范围大、成本低等特点[5]。

机器学习作为一种新型技术,开始主要用于图像识别、监督分类等方面[6],但随着技术的不断提高,近年也被用于近岸海底地形反演,并取得较好效果。Ai等[7]基于卷积神经网络对遥感影像部分波段的特征信息进行学习,并取得较好的预测结果; Liu等[8]提出一种一维卷积神经网络深度学习方法,根据原始实验回波数据直接反演水深,结果表明,该深度学习方法对于处理大量LiDAR测深回波波形具有可行性。

本文首先利用卷积神经网络对重力场信息进行训练学习,并将预测结果与船测水深数据、国外水深模型数据进行对比分析;然后,对加入同源重力场产品数据是否会提高模型预测效果进行研究;最后,简要分析训练集的占比(训练集占总数据集的比例)对卷积神经网络预测结果精度的影响。

1 理论方法

1.1 卷积神经网络原理

卷积神经网络(convolutional neural network,CNN)是一种基于深度学习的神经网络模型。与传统的神经网络不同,CNN利用卷积操作和池化操作,能够有效提取数据特征,从而完成对数据的高效分类和识别等任务[9]。

CNN基本组成部分包括卷积层、池化层、激活函数、全连接层等。其中,卷积层是CNN的核心部分,其通过对输入数据进行卷积操作,可以提取出数据的各种特征。为了防止卷积过程中前层网络参数发生变化导致模型训练失败以及保证模型的快速收敛,在进行卷积之前,对输入数据统一进行归一化处理,然后利用3×3卷积核进行卷积。目前对于卷积层数的选取缺乏理论依据,均是通过实验经验进行设置[10]。通过实验分析,本文设置5个卷积层进行处理,第1层卷积使用128个神经元,第2、3层包含256个神经元,第4、5层包含512个神经元。在每个卷积层后面均加入归一化层以及修正线性单元(ReLU)层。加入归一化层的目的是为了使网络快速收敛,同时由于ReLU层中ReLU函数会将坐标和重力信号设置为负值,并且所有深度都设置为0,如果不进行归一化处理,将会导致训练模型出错[11]。在第1、2层卷积后面加入池化层,池化操作通常包括对特征图的某个区域进行最大值或平均值处理,从而减小特征图尺寸。本研究采用最大池化层以2×2为移动窗口、步长为2进行池化处理。在卷积和池化操作之后,CNN会通过全连接层将数据映射到输出类别上。全连接层通常是一个具有多个神经元的网络层,每个神经元都与前一层的所有神经元相连。最后加入dropout层以及回归层,前者是在模型参数过多但训练样本较少的情况下可以最小化网络的过拟合,在一定程度上达到正则化的效果,后者用于回归。对于模型参数,该网络以初始学习率0.001训练10个历元,每个历元迭代3 768次。用于更新权重的优化算法是带动量的随机梯度下降算法。本研究中CNN示意图如图1所示。

图1 CNN原理图

1.2 模型评估指标

本文以决定系数(R2)、均方根误差(RMSE)以及平均绝对误差(MAE)3个指标对预测结果进行评价[12],表达式为:

(1)

(2)

(3)

2 研究区域及数据

2.1 研究区域

本文选取南海(112°~119°E,12°~20°N)作为研究区域,主要因为南海区域地形结构比较典型,且多位学者采用传统方法(如频域法、重力地质法)对该地区进行过研究计算,便于对比分析。

2.2 数 据

本研究使用的船测数据来自美国国家海洋和大气管理局国家环境信息中心(NOAA,https:∥maps.ngdc.noaa.gov/viewers/geophysics/),主要用于深度学习预测海底地形和精度评估。垂直重力梯度异常(VGG)、重力异常(GA)、垂线偏差(DOV)均采用Scripps海洋研究所(SIO,https:∥topex.ucsd.edu/pub/)提供的模型数据。海底地形模型数据分别来自SIO发布的SIOV25.1模型、丹麦科技大学(DTU,https:∥ftp.space.dtu.dk/pub/DTU21/1_MIN/)发布的DTU21BAT模型以及国际海道测量组织(IHO) 和政府间海洋学委员会(IOC) 联合发布的世界大洋海底地形数据GEBCO_2022模型(https:∥www.gebco.net/data_and_products/)。

3 结果与分析

在训练过程中,本文使用3种重力信号数据集,并选取80%的水深数据作为训练集、10%作为验证集、10%作为测试集,每个数据集中水深点数分别为100 182、12 523和12 523,结合§1.1构建的CNN网络以及参数设置对模型进行训练,分析模型训练效果。完成训练后,通过训练集和验证集的误差曲线来分析模型性能(图2)。

图2 模型训练进度

从图2可以看出,训练集和测试集的损失函数曲线在迭代约700次时达到饱和状态,曲线接近于0。结合图3、4可以得出,本次模型训练效果良好,预测水深与船测水深具有较好的线性关系。通过计算可知,R2值为98.3%,测试点误差呈现标准正态分布,且大部分都在-300~300 m之间。

图4 测试点误差分布直方图

3.1 与船测水深数据对比分析

通过训练得到的模型对全部数据集进行预测,并与船测水深数据进行精度对比,绘制预测结果与船测水深空间分布图(图5)。通过3σ准则筛选出异常值,并将精度统计结果呈现在表1和反演误差分布直方图(图6,图中蓝色线代表以100 m为间隔,反演误差在每个分段占总数的百分比曲线)中。

表1 CNN预测水深模型与船测水深模型精度统计

图5 CNN预测水深和船测水深空间分布

图6 误差分布直方图

通过图6可以看出,反演误差符合正态分布,且在-300~300 m范围内点数占总点数的95%以上。结合表1可知,CNN预测结果与船测水深的误差平均值为7.955 m,标准差为88.289 m。

3.2 与国外水深模型对比分析

将CNN训练得到的预测结果分别与SIOV25.1、DTU21BAT、GEBCO_2022模型进行对比分析。首先绘制CNN预测水深与其他各模型水深空间分布图(图7),然后进行精度统计(表2)。

表2 精度统计

图7 预测水深与其他各模型水深空间分布

从图7可以看出,在浅海地区,CNN预测模型与其他模型存在较大差异,这主要是因为本次模型是利用水深数据进行学习,而船测数据在浅海地区数据相对较少,同时也缺乏陆地数据。由表2可见,CNN预测结果与SIOV25.1、DTU21BAT、GEBCO_2022模型的误差平均值分别为-4.358 m、-3.749 m、0.014 m,标准差分别为124.989 m、127.563 m、130.826 m。

3.3 垂直重力梯度异常、垂线偏差、重力异常的不同组合反演结果对比分析

研究表明[13-14],利用重力场产品数据进行融合可以提高海底地形反演精度。§3.2使用3种重力信号进行反演,难以区分不同类型数据的影响。为了分析不同类型数据的贡献,使用不同数据类型进行深度学习,并对预测结果进行对比分析(表3)。

表3 不同组合的学习结果统计

由表3可知,随着SIO模型重力场数据的加入,反演结果与船测数据之间的标准差逐渐减小。结果表明,同源重力场信息的加入可以有效提高深度学习算法反演海底地形的精度,图8为全部水深点处误差分布,可以看出,反演误差在-200~200 m范围的比例在逐步提高,进一步验证了该结论。

图8 全部水深点处反演误差分布直方图

从图9可以看出,在水深大于2 000 m时,随着重力信息的加入,误差标准差在逐渐降低,说明重力信息的加入可以提高深海区域海底地形反演精度;而在水深小于1 000 m时,根据图中-1 000~0 m变化趋势可知,该区间水深反演精度的提升主要归功于垂线偏差数据的加入,重力梯度数据并未提升反演精度。理论上,在深度学习中,高精度数据的加入可以提高预测精度,精度较低数据的加入可能会导致预测结果较差,因此本研究出现以上结果可能是因为在水深小于1 000 m区域,重力梯度数据的精度较低。

图9 标准差随水深的变化

3.4 船测数据数量对反演结果精度的影响

§3.1~3.3都是基于以80%船测水深数据作为训练集、10%作为验证集、10%作为测试集对海底地形反演精度进行研究,为分析不同数量训练数据的影响,本节分别以80%、70%、60%以及50%的船测水深数据作为训练集,其他数据集占比不变,分析不同训练集数据量对海底地形反演精度的影响,统计结果见表4。

表4 不同训练集数据量海底地形反演结果精度统计

为了更直观地观察不同数据量的反演结果精度变化情况,图10为反演误差随训练集数据量变化的标准差曲线。

图10 标准差随训练集占比的变化

结合表4和图10可以看出,分别以训练集占比80%、70%、60%以及50%进行模型训练,并将预测结果与船测水深数据进行精度统计,得到标准差分别为88.289 m、91.526 m、92.833 m、96.022 m,表明随着训练集数量的增多,CNN模型训练效果逐步提高,水深预测结果精度逐渐提高。

4 结 语

本文利用重力异常、垂线偏差、垂直重力梯度异常数据和船测水深数据,对CNN神经网络模型进行训练,预测南海地区海底地形。通过与真实船测水深、SIO模型、DTU模型以及GEBCO模型数据进行对比,得到标准差分别为88.289 m、124.989 m、127.563 m、130.826 m。将重力信息分成4组进行训练并预测:重力异常,垂直重力梯度异常与重力异常,垂线偏差与重力异常,以及垂线偏差、重力异常与垂直重力梯度异常。根据统计结果可知,4组数据反演结果与船测水深之间的标准差分别为104.780 m、102.778 m、93.788 m、88.289 m,表明同源信息的融合可以提高水深反演精度。最后,研究分析训练集占比对CNN模型预测结果精度的影响,结果表明,数据量的增多可以有效提高模型学习结果的精度。基于深度学习的水深反演无需建立物理原理模型,且便于融合各类数据进行联合反演。未来随着海洋重力场数据的丰富[15],深度学习在海底地形反演中有望发挥更大作用。

猜你喜欢
水深重力反演
疯狂过山车——重力是什么
书法静水深流
基于水深分段选择因子的多光谱影像反演水深
反演对称变换在解决平面几何问题中的应用
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
仰斜式重力挡土墙稳定计算复核
一张纸的承重力有多大?
GPS RTK技术在水深测量中的应用
叠前同步反演在港中油田的应用