多尺度神经网络煤层气微地震检测研究

2023-10-07 13:07刘小秋宋利伟董宏丽
煤矿安全 2023年9期
关键词:煤层气信噪比尺度

张 岩 ,刘小秋 ,宋利伟 ,董宏丽

(1.东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318;2.东北石油大学 物理与电子工程学院,黑龙江 大庆 163318;3.东北石油大学 人工智能能源研究院,黑龙江 大庆 163318;4.黑龙江省网络化与智能控制重点实验室,黑龙江 大庆 163000)

与常规碳酸盐、砂岩储层相比,我国大多数煤矿地质条件复杂、各向异性较强、吸附态高、煤层渗透率低,几乎都需要通过水力压裂进行储层改造[1]。微地震监测技术是检测压裂效果,把煤层气开采与原煤开采结合起来的重要环节,是一个不可忽视的技术。利用该技术能清楚地认识到煤层气压裂井的空间展布形态、几何参数、延伸方位以及随时间变化的特征[2],能更好地监测煤层压裂裂缝的发育方向和空间展布特征,可以提高找寻煤层气气藏的效率、缩短和降低储层检查测的周期与费用[3]。

煤层气微地震信号受地面噪声和地层的吸收衰减影响,信噪比普遍较低[4]。压制噪声是提高检测准确率的普遍思路[5-8]。此类在事件识别前进行相应滤波、去噪算法的方法,一般基于某种先验或通过建立数学模型来刻画噪声特征并加以去除,往往会损坏原始信号中代表有效事件的隐藏特征引起检测错误,从而导致煤层气裂缝和孔隙发育的误判。因此研究直接从监测资料中检测微地震的方法至关重要。此类方法的原理是根据微地震事件与噪声特征的明显差异,进行聚类或分类处理,在微地震事件信号能量较强的情况下具有一定的效果,但是煤层气微震往往震级较小,且受噪声影响严重,需要研究一种适应于煤层气微地震噪声大、震级小的高精度自动检测方法[9-11]。

目前,深度卷积神经网络已经在各个领域取得了显著的应用效果,但由于网络对样本质量要求较高,限制在煤层气勘探和开发中的应用[12-13]。因此,提出一种基于多尺度神经网络的煤层气微地震事件检测方法,在深度卷积神经网络模型中引入不确定理论中的可信度(Certainty-Factor,C-F)模型,首先用地下介质模型构建训练数据集,然后用实际数据测试模型性能。通过多尺度卷积神经网络提取微地震信号的浅层波形特征和深层语义特征,利用不同尺度的特征进行可信度建模得到各个尺度检测置信度。最终检测结果通过可信度模型进行不确定性的信任度融合,得到的结果具有更高的置信度。

1 原理方法

1.1 多尺度特征

传统检测网络结构中,检测器通常接入卷积神经网络最后1 层进行预测,深层特征图无法提供细粒度的信息,寻求多尺度上的特征表达是解决细粒度丢失的有效办法[14]。因为卷积神经网络层层相叠的结构,特征图越深,感受野越大。因此,网络内不同深度的特征图就形成了特征图的多尺度表达。SSD 算法和 MS-CNN 算法提出直接在不同尺度的特征图上分别检测目标,最后进行整合的思想。其中浅层特征图负责检测识别细节目标,深层特征图负责检测主体目标。

传统网络在得到高尺度特征图后,在最后1层进行预测。多尺度检测网络不仅可以得到不同尺度的特征图,还对不同尺度的特征图进行预测。不同尺度的特征图分配权重进行加权融合处理时,总体损失函数E表达如下:

式中:l为 不同的尺度;L为尺度的总量; ωl为尺度l损失的加权因子;El(αl)为尺度l的损失; αl为尺度l的特征图。

尺度l的损失大小受该尺度特征图影响,该尺度特征图与相应的卷积核和偏置有关。用f(·)表示加权方式,式(1)可以写成:

式中:Kl为尺度l的卷积核;bl为尺度l的偏置项。

1.2 可信度模型

神经网络在分类时输出类别置信度分数,通常通过对置信度进行阈值判别预测结果,此类判别方法往往不利于网络表达知识的不确定性。可信度模型可以结合各个尺度的置信度分数,经过不确定性推理得到融合结果,是一种有效的不确定性推理方法。结合该模型将神经网络各个尺度的检测结果作为证据,最终识别结果作为结论,每个尺度的检测结果和最终结果的关系为知识,知识不确定性可以用产生式规则表示为:

式中:CF(H,Ei)为可信度因子(静态强度)表示知识的强度,即当Ei所对应的证据为真时,Ei对H的影响程度为CF(H,Ei)。

模型中用于微地震事件检测时,式(3)的含义为:在尺度i上检测为微地震事件时,确实为微地震事件的可信度为CF(H,Ei)。相关证据的出现提高结论H为真的可信度,则CF(H,Ei)>0,表示证据的出现支持H为真,会使CF(H,Ei)的值变大;反之CF(H,Ei)<0,表示证据的出现支持H为假,CF(H,Ei)的值则会变小;CF(H,Ei)=0,表示证据的出现与结论无关。静态强度由先验概率P(H)和后验概率P(H|Ei)求出,但是在实际应用中,先验概率和后验概率很难获得,一般情况下静态强度直接由专家直接给出,原则是相应的证据的出现越是支持H为真,CF(H,Ei)就应该越大;反之,则越小。

模型将知识和证据的不确定性通过逐步推理传递给结论。结论H由Ei所对应的证据推理得到的可信度表示为CFi(H),由下式计算:

式中:CF(Ei)为动态强度,表示证据Ei当前的不确定性程度。

分别求出每个尺度上检测为微地震事件的可信度,然后用结论不确定性算法合成最终结论的可信度,最终结论的可信度综合了多个尺度上知识的不确定性,在一定程度上可以提高检测的准确性。用CFi,j(H)表示Ei和Ej综合影响所形成的可信度,结论不确定性算法[17]如下:

当CFi(H)<0,CFj(H)<0时:

2 多尺度检测模型

2.1 模型构建

多尺度检测神经网络模型结构如图1。采用4个检测尺度,每个检测尺度分别由卷积、归一化、激活函数组成。每个尺度后分别与对应的检测器相连,检测器由3 个池化层和3 个全连接层交替组成,检测器把结果输入C-F 模型中进行决策。地震事件检测属于二分类问题,盲目加深网络会加大模型存储,还可能导致在求解最优解过程中梯度消失;模型随着卷积神经网络的加深,逐步减少卷积核的大小,提高细粒多尺度表达。

图1 模型结构Fig.1 Model structure

多尺度网络检测是建立在对多尺度特征图的独立识别上的,样本检测的最终检测结果通过标签进行监督训练。原始数据经过预处理得到样本和标签,经过预处理的样本通过多尺度网络进行多尺度特征图的提取,多尺度特征图送入检测器进行检测,并计算每个尺度的精确度。将每个尺度检测得到的置信度作为动态强度、精确度作为静态强度送入可信度模型,得到最终的合成结果,最终合成结果与标签计算损失误差和各项评价指标。

2.2 实验数据

实验数据分为正演数据和实际数据。正演实验用理论地下介质模型,模拟实际煤层气压裂数据。实际数据为黑龙江某地区的实际监测数据。

正演速度模型如图2。正演模型尺寸为4 000 m×4 000 m,将其划分为10×10 的网格点,其中下层介质速度为5 000 m/s,厚度为2 600 m,上层介质速度为3 000 m/s,厚度为1 400 m。模型中心(2 000,2 000)为水力压裂震动裂缝。在地表每隔10 个网格点布置1 个检波器,对裂缝产生时的震动进行监测。

图2 正演速度模型Fig.2 Forward velocity model

实际监测地区的介质特性如下:储层孔隙度7.5%~17.6%,渗透率0.15×10-3~4.94×10-3μm2。孔隙度主要分布在12%~16%范围,渗透率主要分布在0.1×10-3~1.5×10-3μm2范围。平均孔隙度为13.9%,平均渗透率为1.23×10-3μm2。

正演介质模型较实际地质情况相对简单,添加的噪声通过高斯随机噪声模拟。实际数据中噪声来自真实环境背景噪声,更为复杂、更容易误检。正演数据和实际数据的采样周期需要保持一致,以保证样本能包含完整的微地震事件特征。

采用滑动窗口的方法进行数据扩增和解决训练过程中样本均衡的问题,以适应神经网络对样本的要求。滑动窗口处理数据如图3。a为滑动窗口长度,s为滑动步长,L为数据的总长度。

图3 滑动窗口处理数据Fig.3 Sliding window processing data

样本使用独热编码,含微地震事件为正样本标注为1,只含背景噪声的为负样本标注为0。获得的样本总量n为:

检波器接收微地震数据时,大部分都是背景噪声,有效波形只占小部分,得到的正样本的量远少于负样本的数量,随机去掉部分负样本使得正、负样本数量相当。正演数据中单道微地震信号检波器采样点为1 0000,滑动窗口长度设置为100、步长设置为20,可以得到数据9 995 个样本,其中包含微地震事件的样本为245 个。舍去多余负样本后,相比单纯设置长度100 分割数据的方法,扩增了4.9 倍。

2.3 模型训练

网络构建全局损失函数,在神经网络训练过程中,以损失为优化目标反向传播误差,调节卷积核参数。用二值交叉熵(Binary Cross Entropy ,BCE)损失函数,定义如下:

式中:C为样本个数;为第i个样本的标签;y为第i个样本的预测值。

训练集包含4 000 个样本,批量大小设为200,迭代次数设置为500,学习率设为0.01,最后保存调整好的网络参数。模型采用Python 语言和Pytorch 框架作为编程环境。实验在配备Intel Core i7 9700k 处理器和32G 内存的计算机上运行。训练和测试过程中的模型损失和准确率曲线如图4。

图4 模型损失和准确率曲线Fig.4 Model loss curves and accuracy curves

由图4 可知:在迭代40 次后训练损失和测试损失都下降不明显,准确率和损失在后60 个迭代中改变都很小,损失最终下降到0.054,准确率最终达到98%,模型收敛。

3 实验结果

3.1 正演信号模型

考虑到微地震信号采集实际过程中受环境和设备等不确定性因素的影响,将测试集样本中加入不同强度噪声输入性能良好的网络中。不同信噪比正演信号如图5,模型检测结果见表1。

表1 模型检测结果Table 1 Detection results of model

图5 不同信噪比正演信号Fig.5 Simulation signal with different SNR

由图5 可知:随着信噪比减小,噪声污染愈加严重,甚至几乎淹没有效信号。当无噪声以及加入噪声后信噪比为21 dB 时,微地震事件清晰可见;当加入噪声后信噪比为11 dB 时,噪声开始明显影响有效信号;当加入噪声后信噪比为6 dB 时,有效信号完全淹没在噪声中,肉眼难以甄别。

由表1 可知:800 个测试样本中包含微地震波形的正样本为400 个;当无噪声干扰时得到TP 和FN 均为400,即包含微地震波形的样本和不包含微地震波形的样本都全部被无误地检测出来。随着信噪比降低,噪声干扰越来越大,越多正样本被噪声淹没,检测结果的准确率也逐渐降低。正演数据检测结果如图6。

图6 正演数据检测结果Fig.6 Detection results of forward data

为验证本文模型的性能,对比不同方法对微地震波形的检测能力,分别用小波分析法、BP 网络、CNN 网络和本文提出的多尺度检测神经网络对不同信噪比的微地震资料进行检测。不同噪声强度下的准确率如图7。

图7 不同噪声强度下的准确率Fig.7 Accuracy under different SNR

由图7 可知:本文模型结合了多尺度特征,检测效果最好,甚至在无噪声污染(信噪比为30 dB)时,准确率可以达到99.99%;轻微噪声污染(信噪比为21 dB)时,准确率可以达到97.38%。

为了更客观地评价模型的检测效果,引入评价指标精确率P和召回率R,其定义如下:

不同方法在不同噪声强度下的精确率见表2。不同方法在不同噪声强度下的召回率见表3。

表2 不同方法在不同噪声强度下的精确率Table 2 Accuracy rates of different methods under different noise intensities

表3 不同方法在不同噪声强度下的召回率Table 3 Recall rates of different methods under different noise intensities

由表2、表3 可知:在无噪声污染的情况下,4 种方法的精确率和召回率都在0.94 以上;随着噪声干扰变大,精确率和召回率都呈不同趋势下降。总体上4 种方法都呈现出精确率和召回率随噪声干扰增大而减少。且3 种深度学习的方法的精确率和准确率都是由BP 模型、CNN 模型、本文模型逐渐升高。小波分析法的精确率和召回率受所设定阈值影响,阈值越大,越多正样本无法被检测到,阈值越小,越多负样本被误检。在样本上经过反复实验,阈值选取为0.13,此时只有极少的负样本被检测为正例,精确率较高,但是有部分正样本被检测为负例,模型召回率较低。

3.2 实际信号检测结果

由于煤层厚度、泊松比、渗透率、孔隙率等差异,不同区域的煤层气微地震波形所含噪声差异很大,同一地区因为设备和作业环境采集的微地震数据也会有很大的差异。压裂井的部分监测实际数据如图8,每组数据有27 道,每道为32 000 个采样点,其中,微地震事件的信噪比主要集中在2~6.8 dB,能级主要集中在-3.26~-1.82之间。实际数据检测结果如图9。

图8 实际数据Fig.8 Actual data

图9 实际数据检测结果Fig.9 Actual data detection results

利用网络对实际波形数据进行微地震事件检测,结果表明:本文方法能有效判别微地震事件,因此具有良好的检测能力。

4 结 语

1)模型利用神经网络有高度非线性的特点,综合微地震信号的多尺度特征来进行信号自动识别,具有准确、快速、无需设定阈值等优点。

2)用准确度、精确率、召回率评价模型检测能力,在煤层气微地震信号信噪比大于6 dB 的情况下,模型检测准确度大于91.13%,精确率达到92.1%以上,召回率能达到90%以上。

3)黑龙江某地区实际监测数据验证显示,模型能有效地检测出微地震事件时间段。在煤层气开采过程中,通过对煤层气微地震资料进行事件的精确检测对后续反演、裂缝监测有很重要的意义。

猜你喜欢
煤层气信噪比尺度
财产的五大尺度和五重应对
基于深度学习的无人机数据链信噪比估计算法
2019年《中国煤层气》征订单
煤层气吸附-解吸机理再认识
低信噪比下LFMCW信号调频参数估计
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
宇宙的尺度
DFS-C02V煤层气井高产因素简析
保持信噪比的相位分解反褶积方法研究
9