基于有监督机器学习基坑变形预测模型的比较与分析

2022-12-01 08:54吴福成叶建新曾绮琪聂竹林王凤之
广东建材 2022年11期
关键词:预测值深基坑基坑

吴福成 陈 伟 缪 丹 叶建新 曾绮琪 聂竹林 王凤之

(1 广州广检建设工程检测中心有限公司)

(2 广东省建筑物健康监测与安全预警工程技术研究中心)

0 引言

改革开放以来,深基坑工程数量及基坑开挖深度递增,且大多出现在城市繁华地区。基坑影响因素多,施工难度大,给城区带来许多安全问题。因此,有必要对深基坑变形进行安全监测,并对深基坑位移进行预测分析,做到提前预警,提供充分时间处理危险基坑。在过去,由于监测数据不足,深基坑变形预测效果不佳。随着广东省住房和城乡建设厅新出台的《基坑工程自动化监测技术规范》(DBJ_T 15-185-2020)[1],自动化监测技术的规范和提高为深基坑变形预测数据的大量收集提供了实现条件。由于影响基坑变形的因素有很多,目前,研究人员倾向于用SCM 法代替繁琐的理论分析法和需要模拟实际情况的有限元数值模拟法来完成深基坑位移预测任务[2]。根据研究者对基坑位移预测所制作的数据集不同,基坑位移预测可以大致分成两类,一类是根据类似基坑资料进行的预测,另一类是根据已监测数据进行的预测。前者是根据已开挖的类似工程概况的数据建立数据集,进行位移预测;后者是根据同一基坑前期监测得到的位移数据建立数据集,进行位移预测,大部分预测模型针对后者[3]。

基于软计算深基坑位移预测模型使用的机器学习算法有灰色模糊[4],时间序列回归[5],卡尔曼滤波[6],SVM[7],RF[8],ANN[9-11]以及使用遗传优化混合预测算法[4,12-15]等。其中,基于灰色模糊预测和时间序列预测方法仅仅适用于短期预测,卡尔曼滤波在数据处理上运用较多,三者均仅能按照其时序变化进行回归预测,无法分析多个因素造成的位移变化。而基于SVM、RF、ANN 等预测模型属于有监督学习的机器学习算法,不仅其基坑变形预测精度较高,还能分析对位移造成影响的多个因素。

支持向量机应用广泛,由于能够进行线性和非线性的预测回归以及异常值测量等任务,部分学者利用SVM进行基坑变形预测估计。利用SVM 进行分类任务,是在两个类别间寻找尽量大的间距,而预测回归任务则是在限制了间距大小情形下,尽量放置更多的样本到间隔上[16]。随机森林是由多个决策树预测模型使用Bagging 或pasting 算法融合得到。同支持向量机一样,决策树既可以用于分类任务也可以用于回归任务。林楠[8]等建立了SVM 和RF 深基坑位移预测模型,通过一个实际桩顶水平位移预测算例,得出RF 深基坑位移预测模型精度更高的结论。ANN 法是深基坑位移预测中使用较多的机器学习算法[17]。常见的神经网络结构有前馈神经网络,反馈神经网络和自组织网络[18]。神经网络算法的优点是具有良好鲁棒性,可以容许一定数据误差。并且神经网络算法具有极强非线性映射能力,可以自动逼近任何非线性数学函数,尤其在变量关系未知复杂,难以统计处理的情况下[19]。然而,对于使用人工神经网络模型预测基坑位移,确定神经网络模型中的超参数是建立人工神经网络模型中最重要也是最困难的任务[2]。数据量过少,而神经网络架构过于复杂会导致过拟合。确定神经网络模型,首先需要确定输入层、输出层的神经元个数。其次是隐藏层层数以及每层隐藏层神经元个数。在深基坑位移预测任务中,输入层的神经元个数由考虑影响基坑变形因素个数决定,而输出层的神经元个数由输出基坑变形个数决定。然而,目前为止仍旧没有一个统一的理论来确定一个最佳的神经网络模型,只能通过前人经验以及不断试验确认预测成绩相对较优的神经网络模型。另外一些研究者指出人工神经网络收敛速度较慢,数据集制作或超参数设置不合理容易局部优化,导致预测结果误差较大等问题。利用神经网络预测基坑变形有多种模型,不同的神经网络架构和超参数设置讲影响基坑变形的预测结果。用于预测基坑变形的常用神经网络架构有传统的BP 神经网络[20]、RBF 神经网络[21]、广义回归神经网络(GRNN)[11]、Elman 神经网络[10]和LSTM 神经网络[22]。其中,BP 和RBF 神经网络属于前馈网络,广义回归、Elman 和LSTM 神经网络属于反馈神经网络。为了提高人工神经网络模型的预测精度,研究者常常会结合其他机器学习算法,秦胜伍[23]等使用了Stacking 算法将ANN、SVM、RF 预测模型进行了模型融合,得到了精度更高的位移预测模型;Liu[24]等先采用小波变换对变形数据进行了去噪处理,再结合灰色预测算法与BP 神经网络对某深基坑变形进行了预测;Hong 使用了BP 神经网络、基于遗传算法优化的BP 神经网络、外源输入非线性自回归(Based on the nonlinear autoregressive with exogeneous inputs,NARX)神经网络和Elman 神经网络构建4 种不同的人工神经网络预测模型,对施工过程中监测到的混凝土支架轴力、基坑沉降和开挖墙水平位移进行了预测,得出了基于遗传算法优化的BP 神经网络预测模型进行位移预测效果最优的结论[25];Zhan也使用了小波变换对采集到的位移数据进行了去噪处理,基于Elman-Markov 模型,提出了一种预测深海区深基坑地表沉降的新方法并利用马尔可夫链模型对预测值进行修正,实现了深海分区深基坑地表沉降的高精度预测[26]。

为后期预测模型算法选择和进一步预测模型算法优化研究提供定量依据,基于某深基坑实际工程公开位移数据进行了位移预测试验。使用了目前流行的6 个基于有监督机器学习的软计算法预测模型,分别为基于SVM、RF、BP、RBF、LSTM、Elman 位移预测模型,对深基坑位移进行了一至三天位移预测分析,并通过模型预测值精度分析,得出了基于Elman 神经网络的深基坑位移预测模型适用于一天和两天深基坑位移预测,基于BP 神经网络的深基坑位移模型在三天位移预测应用中较为合适的结论。

1 预测模型精度判定

通常用来的评价基坑位移预测模型精度指标有四个,分别为平均偏差误差、平均绝对误差、均方误差、均方根误差。

⑴平均偏差误差(Mean Bias Error,MBE):预测值与真实值差的均值,如公式⑴示。MBE 表示考虑了方向的预测值的平均误差幅度。在评价基坑位移预测模型时,MBE 适宜小于0 说明预测值大于实测值,避免预测的基坑位移过小无法起到预警作用。另外,MBE 的绝对值越小表示预测模型精度越高。

式中,

yi——真实值即基坑位移实测值;

y^i——预测值;

n——数据个数。

⑵平均绝对误差(Mean Absolute Error,MAE):预测值与真实值差的绝对值的均值,如公式⑵所示。表示预测值的平均误差幅度,但不需要考虑误差的方向。MAE越低,表示预测模型精度越高。

⑶均方误差(Mean Square Error,MSE):预测值与真实值差的平方与测试样本数量的比值,如公式⑶所示。对比MAE,MSE 对异常值更敏感。MSE 越低,表示预测模型精度越高。

⑷均方根误差(Root Mean Square Error,RMSE):预测值与真实值差的平方与测试样本数量比值的平方根,如公式⑷所示。RMSE 是MSE 的平方根,可以从单位度量上衡量模型的效果。RMSE 越低,表示预测模型精度越高。

2 位移预测试验

为探究基于SVM、RF、BP、RBF、LSTM、Elman 等有监督机器学习算法的预测模型的基坑位移预测性能,分别基于上述方法建立合适的预测模型,使用郑加柱[6]公开的某地铁车站基坑周边建筑物形变监测点的累计沉降量与开挖深度进行位移预测试验。该项目基坑的基本情况见文献6。

为了更加深入探究各个预测模型的深基坑位移预测性能,试验使用动态预测方案,借助前三天的基坑开挖深度与累计沉降量,分别预测一天、两天和三天的深基坑累计沉降量。公开数据的采集时间为2007 年6 月1 日至2007 年6 月19 日(原始沉降监测数据见表1),按照上述动态预测方案,公开沉降监测数据集一共含有16 个数据。数据集的输入如表2 所示,每次输入3 个基坑开挖深度数据与连续3 天累计沉降量数据,共6 个。由于数据较少,使用验证集验证并测试,不额外划分测试集。6 个模型的训练和验证使用相同的数据集,训练集与验证集的划分比例为7:3,即前11 个数据为训练集数据,其余为验证集数据。

表1 沉降监测公开数据

表2 沉降数据集输入

3 试验结果与分析

根据所需预测天数,制作数据集标签值。预测一天、两天和三天的累计沉降量的每个数据标签值以及对应模型试验结果输出值分别为1、2、3 个,制作的沉降数据集标签见表3。为了综合测试比较6 个预测模型的预测性能,进行了沉降模型精度分析,分别计算了6 个模型得到的训练集、验证集预测结果的RMSE、MAE 和MBE 三个精度指标值。6 个模型预测基坑后一天沉降量、后两天沉降量、后三天沉降量的精度指标值分别如表4~表6 所示。

表3 沉降位移数据集标签

表4 为预测一天沉降模型精度各个指标值,基于Elman 预测模型验证集的RMSE、MAE 最低,分别为0.255和0.233,预测效果较佳,但MBE 为正数,说明模型预测的位移值较低;而基于LSTM 预测模型的RMSE、MAE 仅次于Elman 模型,且MBE 为负数,预测性能较符合实际使用。表5 为预测两天沉降模型精度各个指标值,基于Elman 预测模型验证集的RMSE、MAE 也为最低,分别为0.184 和0.151,且MBE 为负数,预测效果较为优秀。表6 为预测三天沉降模型精度各个指标值,基于BP 预测模型验证集的RMSE、MAE、MBE 均为最低,分别为0.257,0.202 和0.023,说明预测后三天沉降量使用BP预测模型更为适合。

表4 预测一天沉降模型精度分析

表5 预测两天沉降模型精度分析

表6 预测三天沉降模型精度分析

为进一步验证比较6 个模型预测沉降值效果,绘制了6 月4 日至6 月19 日6 个模型预测一、两和三天沉降值对比图,见图1~图3。其中,4 至15 日为训练集预测效果,16 至19 日为验证集预测效果。由图1 可知,基于Elman 预测模型的预测沉降折线与实测值折线最为接近,说明精度指标的可靠性,其预测效果确实较佳,验证集预测值较低,但在可接受范围内。而基于LSTM 预测模型预测沉降折线在训练集前期预测效果不佳。由图2可知,Elman 预测模型的预测沉降折线与实测值折线较为近似,也在可接受范围内出现验证集预测值较低的情况。图3 为6 个模型预测三天沉降值对比图,基于BP 神经网络预测模型的预测沉降折线与实测值折线最为靠近,且预测值结果符合实际需要,验证了预测后三天沉降量使用BP 预测模型更为适合的结论。

图1 预测一天沉降值对比

图2 预测两天沉降值对比

图3 预测三天沉降值对比

4 结论

对基于SVM、RF、BP、RBF、LSTM、Elman 等有监督机器学习算法的预测模型进行了实际深基坑工程位移预测试验,通过公开预测数据验证集的模型预测值精度分析。基于BP、Elman、LSTM 神经网络预测模型的预测位移精度均高于其余预测模型,验证了人工神经网络的优越性。基于Elman 神经网络预测模型在预测一天和两天沉降任务中,验证集RMSE 和MAE 均为最小值,预测精度最高;但验证集MBE 为负值,预测值较实测值较低。基于BP 神经网络预测模型在预测三天沉降任务中,验证集RMSE 和MAE 均为最小值,且验证集MBE 为负值,预测性能最优,适合基坑多天位移预测任务的结论。

猜你喜欢
预测值深基坑基坑
微型钢管桩在基坑支护工程中的应用
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
全套管全回转咬合桩在基坑支护中的技术应用
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基坑开挖及加固方法研究
基于FLAC3D的深基坑开挖模拟分析
法电再次修订2020年核发电量预测值
建筑施工中深基坑支护技术的应用
基坑开挖对邻近已开挖基坑的影响分析
建筑施工中深基坑支护技术的应用浅述