基于时间卷积网络的长江下荆江航道水位预测

2024-01-12 12:55李有为舒章康
水利水运工程学报 2023年6期
关键词:荆江丰水期站点

李 港,李有为,舒章康,张 宇,王 江,查 伟

(1.长江航道勘察设计院(武汉)有限公司,湖北 武汉 430040; 2.国家内河航道整治工程技术研究中心,湖北 武汉 430040; 3.南京水利科学研究院 水灾害防御全国重点实验室,江苏 南京 210029)

水路运输在国民运输中有着极其重要的地位,航道水位是影响船舶通航安全的重要因素[1-2]。长江作为货运量全球第一的内河航道,其下荆江河段蜿蜒曲折,河槽冲刷下切,通航条件相对较差[3]。因此,开展长江中游下荆江河段的水位预测研究,对保障船舶通航安全具有重要意义。

目前水位预测方法主要包括基于机理过程的水动力模型和基于数据驱动的统计模型[4-6]。水动力模型能够较好地实现水位变化的精细模拟,陈炼钢等[7]采用EFDC 模型模拟鄱阳湖的水位变化,提出适宜越冬水鸟的生态水位调控方案;戴凌全等[8]基于MIKE Flood 构建江湖一体化耦合水动力模型,实现洞庭湖白鹤栖息地水位波动的模拟。然而,水动力模型的构建需要非常完善的数据作为支撑,计算复杂,耗时较长,水位预测依赖于边界条件的预测,易造成误差累积,降低水位预测精度[9]。统计模型通过数理统计方法建立水位与影响因素之间的关系,进而实现水位的预测,计算效率高,操作简便,得到了广泛应用[10]。然而,早期的回归方法难以刻画水位与其影响因素之间的非线性关系,预测精度较低[11]。随着机器学习的发展,人工神经网络(Artificial Neural Network,ANN)[12]、支持向量机(Support Vector Machine,SVM)[13]等模型提高了水位预测精度,但均未考虑水位时间的相关性[14]。深度学习模型中的循环神经网络(Recurrent Neural Network,RNN)可考虑短期历史信息的影响[15],能有效提升水位预测精度,但其网络结构仍存在梯度消失和梯度爆炸的问题,导致模型易陷入局部最优解或训练无法收敛[16]。而长短时记忆神经网络(Long Short-term Memory,LSTM)作为RNN 的变体,通过加入门控单元,实现了高精度的水位预报[17];郭燕等[18-19]利用LSTM 准确预测了洞庭湖和鄱阳湖的水位变化;Barzegar 等[20]基于LSTM 模型进行了不同尺度湖泊的水位预测,取得了较好的预测效果。时间卷积网络(Temporal Convolutional Network,TCN)结构中的因果卷积和膨胀卷积可以将时间序列与历史记忆有效结合,计算效率高,在部分时序任务的预测中取得了优于LSTM 的效果[21-22]。然而,目前在水位预测领域对TCN 模型的相关应用还有待进一步探索。

基于此,本研究以长江下荆江河段为研究对象,利用TCN 模型建立荆江下游河段水位站点的日尺度水位预测模型,同时构建相应的LSTM 和SVM 水位预测模型进行对比分析,探究TCN 模型在下荆江水位预报中的适用性,以期为航道内船舶通航安全提供技术支撑。

1 研究区域及数据资料

长江中游荆江河段起于湖北枝城,止于湖南城陵矶(图1),全长约347 km。以藕池口为界,分为上荆江和下荆江,其中下荆江河长约175 km,属于典型的弯曲型河道,由石首、调关及七弓岭等10 个弯曲段组成,各弯道平均曲折系数为1.82,大部分属于急弯河段,通航条件较差[23]。

图1 研究区域及水文水位站点分布Fig.1 Study area and distribution of hydrological stations

研究选用的数据资料包括宜昌站、枝城站和沙市站2019—2021 年的逐日平均流量数据,以及石首站、调弦口站和监利站2019—2021 年的逐日平均水位数据,监测站点分布见图1。建模前需对各站点的水位流量时间序列数据进行归一化处理,消除数据量纲影响,加快模型训练过程中的收敛速度。采用minmax 方法将数据归一化至[0,1]。

2 模型与研究方法

2.1 模型基本原理

循环神经网络(RNN)是处理时间序列任务回归预测的重要手段,卷积神经网络(Convolutional Neural Network,CNN)则主要用于解决图像识别、机器视觉等相关问题。TCN 本质是一维卷积神经网络针对时序问题的优化和改进,网络结构见图2(a),通过使用因果卷积,使TCN 能够适用于序列建模,同时采用扩张卷积让网络能够学到更长的时序依赖信息,避免历史数据信息的丢失,即使不做任何池化操作也可增大感受野的范围 ,使卷积核能够学习更大范围的信息,并且可以并行处理序列数据,所需训练参数较少,计算效率较高[24-25]。扩张因果卷积的计算式为:

图2 时间卷积网络结构和基础单元示意Fig.2 Structure of TCN and schematic diagram of TCN basic unit

式中:X={x1,x2, …,xt}为输入的时间序列;F={f1,f2, …,fK}表示大小为K的卷积核,fK表示卷积操作中filter 的数量;d为扩张率。

此外,TCN 还增加了残差连接,将数据跳过中间的卷积操作,经过 1×1 的卷积后直接与经过中间卷积操作的数据相加作为本层最终的输出数据,可有效避免中间层堆叠导致模型在训练过程中出现梯度消失的问题[26]。因果扩张卷积加上残差连接构成了TCN 模型的基本单元,其结构如图2(b)所示。

为了探究TCN 模型在水位预测中的适用性和优越性,同时构建了LSTM 模型及SVM 模型进行水位预测,并进行TCN 模型和两者预报精度的对比分析。LSTM 结构主要包括输入门、输出门和遗忘门3 个门控单元,能够缓解RNN 的梯度消失和梯度爆炸问题,是目前常用于时间序列回归预测的深度学习模型[27]。SVM 是建立在统计学VC 维理论和结构风险最小化原理上的机器学习模型,能够根据样本在模型复杂性和预测学习能力之间取得最佳平衡,在水位预报领域得到了较为广泛的应用[5,28-29]。

2.2 水位预测方法

研究以2019 年和2020 年流量水位数据为模型的训练数据集,2021 年的水位数据为验证数据集;采用宜昌站、枝城站及沙市站的日均流量,以及待预测站点的水位作为输入数据,分别预测下荆江河段石首、调弦口及监利站2021 年的水位。考虑到下荆江各站点的水位与上游各站点的流量之间存在时间滞后,分别设置宜昌站、枝城站、沙市站3 个站点及待预测站点前1 d 至前10 d 共30 种滞时方案下的流量水位作为输入,进行下荆江河段石首、调弦口及监利站未来1 d 的水位训练与预测,以确定最优的输入时间窗口,获得最佳的水位预测效果。由于网络训练过程中,初始权重赋值的随机性,会使模型的水位预报结果存在一定差异,因此,最终的水位预报结果为同一参数下进行10 次数值试验的平均值。

本研究所有的数值试验均在Windows 系统上(CPU: AMD R7-5800H@3.2GHz,GPU: NVIDIA GeForce RTX 3050Ti),采用Python 开发语言(3.6.12)基于TensorFlow(2.1.0)和Keras(2.3.1)深度学习框架实现。

模型选取纳什系数(Nash-Sutcliffe Efficiency Coefficient,ENS)、均方根误差(ERMS)及决定系数(R2)3 个指标进行石首、调弦口及监利站水位的模拟预测精度评价。

3 结果与分析

3.1 模型参数确定

3.1.1 模型超参数 超参数设置对模型的预报精度具有较大影响。模型采用的优化算法是适应性动量估计算法(Adaptive moment estimation, Adam),能自适应学习率加快网络收敛速率,沿梯度的负方向更新参数,是目前深度学习中应用最为广泛的优化算法[14];激活函数选用ReLU 函数,其优势在于能够快速训练网络,防止模型训练过程中出现梯度消失问题[30];同时模型的Dropout 层以一定比例随机丢弃神经元,能有效防止模型发生过拟合。此外,对模型性能影响较大的超参数还包括卷积核尺寸和卷积核个数。分别设置Dropout 为0.2、0.3、0.5,卷积核尺寸为2、3、4、5,以及卷积核个数为8、16、32、64,采用网格搜索法确定最优的参数组合;其余如初始学习、率膨胀因子等敏感性较低的超参数按照经验值设置[31],最终TCN 模型的超参数取值见表1。

3.1.2 最优输入时间窗 除了模型的超参数外,输入时间窗口对水位的预报精度也有较大影响,因为流量和水位并不是同步变化,存在一定的时间滞后,进行模型不同输入时间窗的优选计算,分析滞后时长对当前水位的影响程度,确定流量-水位之间最优滞后关系,进而获得最佳的水位预测效果。本研究计算并比较了输入时间窗为1~10 d 时各站点在训练期和预测期水位的模拟预测精度,计算结果见图3。可见,不同时间窗下,TCN 模型在训练期和测试期的水位模拟预测精度存在一定差异,各站点训练期最优精度对应的输入时间窗口与测试期的相同,模型训练期和测试期模拟预测精度均较高,具有较好的一致性,不存在过拟合现象,这表明模型具有较好的鲁棒性和泛化能力。总体而言,TCN 模型在合适的输入时间窗口下能够获得高精度的水位预测效果,监利站、调弦口站及石首站对应的最优输入时间窗口分别为2、2 和3 d。

图3 不同输入时间窗口下3 个站点训练期和测试期的水位预测效果Fig.3 Water level prediction in training and testing periods of three stations under different input time windows

3.2 不同模型预测精度分析

图4 是TCN 模型在对应最优输入时间窗口下,训练期和测试期3 个站点未来1~3 d 的水位模拟预测结果。总体而言,TCN 在下荆江不同水位站点处训练期和测试期的水位预测值与实测值吻合较好,能较好捕捉水位的峰谷值。

图4 TCN 模型在不同站点处未来1~3 d 的水位预测值与实测值对比情况Fig.4 Comparison of predicted and measured water level of TCN model at different stations in the next three days

表2 是TCN 模型与LSTM 模型及SVM 模型在不同站点处测试期的水位预测精度对比。整体上TCN 预测效果最好,SVM 预测效果较差。TCN 在监利站和调弦口站的3 个水位预测精度评价指标均略优于LSTM,但差异较小;在石首站的水位预测中,TCN 的ENS和ERMS略低于LSTM,R2优于LSTM,这表明TCN 模型对石首站水位的拟合程度较高,但预测的绝对偏差略大,两种深度学习模型在下荆江河段3 个站点未来1 d 的水位预测精度均较高,在对应的最优输入时间窗口下,ENS和R2均能达到0.995 以上,ERMS基本小于0.2 m。随着预测时间尺度的增加,TCN 和LSTM 的预测精度均呈现不同程度的降低,TCN 在未来2 d 和未来3 d 的预测精度相较于LSTM 有了一定的提升,3 个精度评价指标结果均优于LSTM 模型。总体而言,LSTM 的水位预测已达到较高精度,而TCN 的水位预测精度更高,这主要是因为LSTM 虽然通过门控单元缓解了RNN 的梯度问题,但遗忘门还是会以一定的概率丢弃历史信息,当序列长度超过一定值后,仍会出现梯度消失问题[32],而TCN 反向传播路径是沿着网络深度方向,而非LSTM 的序列时间方向,避免了LSTM 在过长时间序列上的梯度问题,能够在一定程度上提高预测精度。

表2 TCN、LSTM、SVM 在不同站点处2021 年的水位预测精度Tab.2 TCN, LSTM and SVM prediction accuracy of water level in 2021 at different stations

3.3 不同时期预测精度分析

表3 是各站点TCN 模型水位预测结果在丰水期和枯水期不同区间绝对误差出现天数,其中,丰水期统计时段为5—10 月,枯水期统计时段为11 月—翌年4 月。在未来1 d 的水位预测结果中,枯水期的绝对误差基本小于0.2 m,而丰水期则基本小于0.5 m;未来2 d 和未来3 d 的预测结果中,预测精度随预测时间尺度的增加呈降低趋势,绝对误差大于0.5 m 的天数增加,丰水期绝对误差大于0.5 m 的最大出现天数为27,枯水期为13。总体而言,各站点枯水期在不同时间尺度的预测绝对误差均显著优于丰水期,这主要是因为历史数据中丰水期的水位流量高值数据相对较少,模型训练过程中,为达到最优精度,预测结果会向样本数量较多的枯水期低水位值趋近[33]。对于航道水位预测,保证枯水期的水位预测精度可以有效保障船舶的通航安全,而丰水期的水位预测可以在后续研究中通过加入更多年份的历史数据进行模型训练,进而提升丰水期水位预测精度。

表3 3 个站点未来1~3 d 预测结果不同区间绝对误差在丰、枯水期出现天数Tab.3 The number of days with different absolute error in the next three days in dry season and wet season单位:d

4 结 语

本文利用TCN 模型进行了下荆江航道不同站点未来1~3 d 的水位预测,并与当前广泛应用的LSTM和SVM 模型进行预测效果的对比,分析了TCN 模型在水位预测中的适用性和优越性,可为船舶通行安全提供技术支撑,主要研究结论如下:

(1)监利站、调弦口站及石首站对应的最优输入时间窗口分别为2、2 和3 d 时,TCN 模型能够获得下荆江各站点未来1 d 的最佳预测效果,ENS和R2均大于0.995,ERMS基本小于0.2 m;但随着预测时间尺度的增大,预测精度整体呈降低趋势。

(2)TCN 模型和LSTM 模型的预测效果显著优于SVM 模型,在水位预测领域具有较好的应用潜力,TCN 模型在不同时间尺度下的预测精度整体优于LSTM 模型。

(3)TCN 模型在枯水期的水位预测效果优于丰水期,枯水期各站点未来1~3 d 水位预测绝对误差大于0.5 m 的最大天数为13,大部分时段水位预测的绝对误差低于0.2 m,可有效保证枯水期的船舶通航安全。

猜你喜欢
荆江丰水期站点
用18S rRNA 高通量测序分析比较万峰湖丰水期和枯水期生物多样性
南宁市主要地表水系放射性水平及不同水期放射性水平研究
2016-2019年天桥区城乡生活饮用水水质检测结果分析
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
频率曲线在荆江三口输沙量计算中的应用
首届欧洲自行车共享站点协商会召开
怕被人认出
荆江航道整治工程完工长江航运“瓶颈”初步打通
滇池流域入湖河流水文形貌特征对丰水期大型底栖动物群落结构的影响