基于LeNet 模型的游梁式抽油机工况诊断研究

2024-01-12 07:17叶哲伟易钦珏

西南石油大学学报(自然科学版) 2023年6期

叶哲伟，易钦珏，罗良

西南石油大学机电工程学院，四川成都 610500

引言

某油田游梁式抽油机井占机采井的97.6%，抽油机井由于受复杂的井下工况影响易出现故障。因此，及时准确地判断井下工况并对抽油机井出现的故障进行实时处理在抽油机井实际生产过程中显得尤为重要。目前，判断抽油机井下工况的主要方式为示功图，示功图表示抽油机的一个运行周期中，抽油机悬点载荷随悬点位移变化的关系曲线图，通过分析示功图能够判断“抽油杆断脱”“供液不足”等井下故障，从而及时处理故障，避免井下事故的发生，油井工人对于示功图的判断通常依靠个人经验，该方法误差大且效率低[1]。在示功图工况诊断领域，研究人员多年来运用专家系统、机器学习等人工智能的方法来实现示功图的识别[2-5]，但由于专家系统需要依靠专家经验，传统机器学习的特征需要人为预先选取，会导致出现相似示功图时，识别的准确度降低，不能很好地满足实际需求。

本文通过深度学习算法模型来实现对示功图的识别，深度学习能够挖掘原始输入数据中具有泛化能力的特征表示[6]，深度学习目前在人脸识别、目标检测等领域应用广泛，深度学习无需人工预先进行特征提取，在图像识别领域，其卷积神经网络分支有着广泛的应用。将深度学习卷积神经网络引入到示功图识别领域，通过卷积神经网络学习示功图的本质特征，从而实现示功图的自动识别。

在卷积神经网络与示功图诊断结合领域，李钰通过搭建MiniAlexNet 卷积神经网络模型实现了示功图的自动分类与识别，但其仅考虑了4 种类型的示功图数据且当示功图数据类型变多时，模型需要继续优化[7]。樊浩杰通过搭建CNN-SVM 卷积神经网络模型实现了示功图的自动识别、分类及诊断，并将此模型应用到抽油机井故障智能诊断系统中，但其仅考虑了8 种类型的示功图数据且模型算法较为复杂需要继续优化[8]。杜娟等通过搭建一种轻量型卷积神经网络LA-CNN，实现了抽油机的故障诊断[9]。Abdalla 等采用深度学习人工神经网络分析了井下示功图特征，识别了有杆抽油系统工况[10]。He 等通过搭建CNN-LSTM 卷积神经网络模型，提高了对于示功图进行诊断的精度[11]。

在前人研究的基础上，本文搭建了基于LeNet的卷积神经网络模型，在简化算法以及模型结构的同时考虑了油井抽油机常见的15 种井下工况，并通过混淆矩阵对所搭建模型进行了可视化分析，证明了所搭建的模型是合理的。实验结果表明，该模型在验证集上对于示功图进行识别的准确度为94.68%，具有较高的工况诊断精度。

1 模型建立

本文介绍了LeNet 卷积神经网络模型和示功图的图像特点，以MATLAB 作为开发平台，搭建了基于LeNet 的卷积神经网络（Convolutional Neural Network，CNN）模型。

1.1 LeNet 卷积神经网络模型

卷积神经网络至今已有30 多年的历史[12]。CNN 为前馈型神经网络，能提取输入图像的本质特征，因此，广泛应用于图像识别领域。CNN 的三个基本思想是“局部感受野”、“权值共享”和“池化”，局部感受野指隐藏层每个神经元只连接上一层一定区域内的神经元[13]；权值共享指特征图上每个窗口数据都共用一套卷积核参数[14]；池化的作用在于特征降维，池化技术主要有最大值池化和均值池化[15]。

LeNet 模型的结构如图1 所示[16]，其为CNN 模型中的经典架构。LeNet 模型通过卷积、池化等操作来进行特征的提取，极大程度上减少了训练参数的数量，并通过全连接层进行分类识别，LeNet 模型从提出之日起，主要应用于银行支票上手写字符的识别，并在该计算机视觉任务上取得了较好的识别效果。

图1 LeNet 模型结构图Fig.1 LeNet model structure diagram

如图1 所示，LeNet 模型的组成包括卷积层、池化层和全连接层。卷积层的作用为提取输入图像的本质特征，卷积操作公式为[1]

池化层的作用为对输入的特征图进行压缩，缩小参数矩阵的大小，进而减小网络模型参数计算的数量，池化操作的公式为[1]

全连接层的作用在于综合经卷积、池化后所提取到的特征，从而形成完整的图，由此实现分类，全连接操作公式为[1]

LeNet 模型具体实现过程为：通过多个不同的卷积核对输入层的图像数据进行卷积操作得到卷积层C1；对卷积层C1 进行池化操作得到池化层S2；对池化层S2 进行卷积操作得到卷积层C3；对卷积层C3 进行池化操作得到池化层S4，将池化层S4 的特征输入全连接层，由此实现图像的识别、分类及输出。

1.2 示功图图像特点

示功图是抽油机悬点载荷随其位移变化规律的图形表示，不同特征类型的示功图对应抽油机井不同的工况，因此，示功图通常用于工况诊断，且对示功图的综合研判是掌握抽油机井工况以及动态的重要手段[17]。在油田抽油机井的实际生产过程中，会出现“油层出砂”“油井结蜡”“抽油杆断脱”和“柱塞脱出泵筒”等故障，当出现故障时，相比正常示功图在横坐标位移区间变化不大，在纵坐标载荷区间呈现不规律变化[18]。图2 为典型故障示功图。

图2 典型故障示功图Fig.2 Typical fault indicator diagram

图2a 为“油层出砂”情况下的示功图，当油层中出现细小的砂粒，使得柱塞在上下冲程中受到附加阻力的影响，从而使得光杆负荷在上冲程增大、下冲程减小，示功图图像特征表现为柱塞在上下行程线上波动较大，波峰和波谷没有规律。图2b 为“油井结蜡”情况下的示功图，由于油井结蜡，使得活塞在运行过程中受到附加阻力的影响，并会产生振动载荷，图像特征表示为上下载荷线出现波浪型弯曲。图2c 为“抽油杆断脱”情况下的示功图，抽油杆断脱后的悬点载荷为断脱点以上的抽油杆柱在液体中的重量，且由于摩擦，使得上下载荷线不重合，图像特征表示为条带状。图2d 为“柱塞脱出泵筒”情况下的示功图，由于防冲击距离过大，柱塞在上冲程中会从泵筒中脱离出来，施加在光杆上的液柱负载会突然卸载，由此导致卸载线迅速下降并引发柱塞跳动，因此，从示功图的图像特征来看，右下角呈现不规则的波浪曲线。上述示功图的案例表明，示功图的图像内容由曲线组成，且曲线内容较少，空白内容较大，因此，对于示功图的识别无需特别复杂的网络模型就能实现较好的识别效果。

抽油机示功图的自动识别与分类问题，可以看作是一类图形识别与分类问题，且深度学习CNN能够分布式表示输入数据的特征，从而完成对特征的提取，进而可以较好地解决示功图工况间存在相似性的问题。因此，研究深度学习CNN 在示功图自动识别和分类方面的应用在技术上可行且有很大的实际应用价值[7]。

1.3 基于LeNet 模型的网络架构

LeNet 模型深度适中，至今仍广泛应用。针对示功图的图像特点，本文以MATLAB 作为开发平台，搭建了基于LeNet 的CNN 模型。在搭建模型的过程中，对输入到CNN 模型的示功图数据进行归一化、二值化及细化处理并且引入了Dropout层和局部响应归一化（LRN）层，其模型结构如图3所示。

图3 基于LeNet 的CNN 模型结构图Fig.3 LeNet-based CNN model structure diagram

第一、第二层为图像处理以及输入层，考虑到不同油井、悬点所承受的载荷以及光杆运行到上死点和下死点的距离不同，会导致示功图形状大致相同但尺寸不同。为了提高示功图的通用性，对示功图进行归一化操作，使得示功图的横纵坐标都在[0,1]内。归一化操作公式为[8]

图4 为实测示功图的归一化处理。

图4 实测示功图的归一化处理Fig.4 Normalization processing of measured indicator diagram

为了突出示功图的图像特征以及避免噪声的干扰，对归一化后的示功图进行二值化及细化处理。图5 为二值化及细化处理后的实测示功图图像。将图像处理后的示功图变为100×100 个神经元并输入到CNN 模型中。

图5 实测示功图的二值化及细化处理Fig.5 Binarization and thinning of measured indicator diagram

第三层为卷积层，卷积核大小为10×10，步长为1，采用Same 策略，卷积核数量为20，卷积结束后会形成20 个通道。

第四层为激活函数，本文的激活函数采用Re-LU，旨在通过加入非线性因素的方式提高神经网络对模型的表达能力。为了防止ReLU 函数出现Dead ReLU 现象，因此，基础学习率设置为0.001，每5 个阶段学习率降低0.2 倍。

第五层为LRN 层，该层为局部神经元的活动创建了竞争机制，使较大的响应值变得相对较大，并抑制其他反馈较小的神经元，其主要作用在于提高模型的泛化能力，其实现公式为[19]

第六层为池化层，池化规则为最大池，最大池化操作是选取图像区域的最大值作为该区域池化后的特征值，池大小为6×6，步长为3，经过池化后为32×32 个神经元。

第七层为Dropout 层，Dropout 层在模型训练的过程中，为了使模型不依赖于局部特征，让某些神经元的激活值以一定的概率停止工作，以达到防止模型过拟合的效果[20]。第八层为全连接层，该模型全连接层含15 个神经元，输入的神经元通过全连接层实现分类。

第九层为Softmax 层，用以将分类输出标准化成概率分布，其实现的公式为

第十层为分类输出层，根据概率得到分类序号。模型训练时的损失函数选用交叉熵，用以刻画预测概率分布和真实概率分布间的距离。

2 案例研究

本文通过某油田的实测示功图数据对本文搭建的基于LeNet 的CNN 模型进行了验证，并通过实验选取了符合该模型的优化器以及超参数，旨在提高模型的收敛速度、识别精度。此外，为了证明Dropout 层和LRN 层的优势，对未加入该两层的基于LeNet 的CNN 模型进行了对比分析。

2.1 数据准备

本文使用的示功图数据集由中国某油田不同的游梁式抽油机井提供，每张示功图数据由144 组坐标点组成，在数据集中，有一些数据是无效的，原因为采集示功图数据时，仪器电源或接触不良引起的故障，或因仪器老化引起的故障[21]，需要在使用前对数据集进行清理。

对实测示功图数据集进行清理后，共获得5 116张抽油机示功图，并按以下15 种类型进行人工分类，各类别对应关系见表1。

表1 抽油机示功图分类表Tab.1 Pumping unit indicator diagram classification

对上述数据集进行如下操作：生成每组数据对应的图像并存储在文件夹中，供模型读取；随机抽取50%的数据作为模型的训练集，剩余50%的数据作为模型的验证集；由此得到的训练集包括2 558张示功图，验证集包括2 558 张示功图。

2.2 基于LeNet 的CNN 模型

2.2.1 优化器的选取

为了提高本文搭建的基于LeNet 的CNN 模型的收敛速度，避免网络模型在训练过程中出现局部最优化现象，需要为本文搭建的模型选取合适的优化器。目前，应用最广泛的优化器包括SGDM、RMSprop 和Adam，因此，本文选取这3 种优化器进行实验验证，实验流程如下。经实验分析，对于该模型，SGDM 优化器效果最佳。

实验保证单一变量原则，训练模型周期为30 轮，最大迭代次数为1 080 次，这里仅使用前700 次模型迭代的数据进行绘图。图6 为模型实验结果图，由图6可知，SGDM 优化器相比RMSprop 和Adam 优化器，验证集上模型的输出损失最小，即预测概率分布与真实概率分布之间的距离最接近，因此，对于该模型，SGDM 优化器的识别效果最好。

图6 优化器选取图Fig.6 Optimizer selection

2.2.2 超参数的选取

本文在训练模型的每个周期中，将数据集中的样本数据分若干次读入，网络模型每读取一次样本数据称为一个Batch，使用Batch 对网络模型进行参数更新的过程称为迭代。本文搭建的模型在训练过程中，将Batch 进一步拆分，并在拆分后的Batch 上进行梯度下降，由此能够提高网络模型的收敛速度以及识别精度。

Batch 拆分后的每一部分数据的数据量称为最小批量更新次数，本文通过实验选取了最小批量更新次数这一超参数的最优值。实验保证单一变量原则，实验结果如图7 所示，由图7 可知，当最小批量更新次数的值设定为71 时，模型对于示功图样本数据进行识别准确度最高。

图7 超参数选取图Fig.7 Hyperparameter selection

2.2.3 基于LeNet 模型的实验

在程序中设置好相关参数后，依据本文搭建的基于LeNet 的CNN 模型进行实验，将实测示功图数据导入模型，用2 558 张实测示功图对模型进行训练，再用2 558 张实测示功图对模型进行验证。实验过程如下，实验训练模型周期为30 轮，每轮迭代次数为36 次，最大迭代次数为1 080 次。

图8 为该模型在验证集上的实验结果，这里使用前1 080 次模型迭代的数据进行绘图，由图8 可知，当模型收敛时，验证集上模型的识别准确度为94.68%，损失为0.262 2。

图8 模型实验结果图Fig.8 Model experiment result

2.3 基于LeNet 模型的对比实验

为了证明Dropout 层和LRN 层的优势，搭建了未加入该两层的基于LeNet 的CNN 模型，其网络结构如图9 所示，并对搭建的模型进行了实验，当模型收敛时，验证集上模型的识别准确度为93.55%，损失为0.292 4，用时13 分13 秒。

图9 对比实验网络结构图Fig.9 Comparative experiment network structure

3 实验结果及分析

3.1 实验对比

传统的机器学习方法包括BP（Back Propagation）神经网络以及SVM（Support Vector Machine）诊断方法，上述两种方法属于浅层学习，其特点为隐藏层的数目通常情况下小于3，浅层学习由于理论分析难度大、对复杂函数的逼近能力有限且训练的过程中需要较多的经验和技巧，如需要人工预先选取矩或矢量曲线特征，导致在实际应用过程中不能达到较好的识别效果。

为了证明本文方法较传统的机器学习方法具有更好的性能，将参考文献[22]中提出的BP 神经网络和SVM 诊断方法与本文提出的基于LeNet 的CNN 模型方法进行比较。各方法对比结果如表2所示。

表2 诊断方法比较表Tab.2 Comparison of diagnostic methods

由表2 可知，基于LeNet 的CNN 模型的识别准确度高于传统的机器学习方法（BP 和SVM）。由“矩特征”方法到“自动特征”方法，识别准确度由70.24%提高到了90.06%，由此可知，机器自学习方法优于特征提取方法。

为了证明Dropout 层和LRN 层的优势，将含有该两层的基于LeNet 的CNN 模型（LeNet 2）与未含该两层的基于LeNet 的CNN 模型（LeNet 1）进行比较，对比结果如表3 所示。由表可知，Dropout 层和LRN 层的加入使得识别准确度由93.55%提高到了94.68%。

表3 LeNet 卷积神经网络模型比较表Tab.3 Comparison of LeNet models

为了进一步证明，Dropout 层和LRN 层的引入，提高了在各类工况上识别的准确度，依据实验结果绘制了如图10 所示的柱状图。由图10 可以看出，随着Dropout 层和LRN 层的引入，提高了在验证集上对于“气体影响”“上行碰泵”“油层出砂”“气液影响油层出砂”和“油井结蜡”识别的准确度。

图10 验证集准确度的柱状图Fig.10 Accuracy of the validation set

3.2 实验分析

对基于LeNet 的CNN 模型LeNet 1 和LeNet 2的实验结果进行分析，结果见图10。由图可知，LeNet 2 模型在抽油机大部分工况下具有较高的诊断精度。其中，“供液不足”“固定凡尔漏失”“气锁影响”“气体影响”“上行碰泵”“抽油杆断脱”“下行碰泵”“液击影响”“油层出砂”“游动凡尔漏失”“正常工作”和“柱塞脱出泵筒”的诊断准确度均超过92.00%；平均诊断准确度为94.68%。

图11 为抽油机工况诊断结果的混淆矩阵，对角线表示验证集中各种工况正确诊断样本的数目。由图11 可知，对于“供液不足”类别，使用验证集的样本去回代训练集训练过的网络，有8 个样本误放入“气液影响油层出砂”类别，有5 个样本误放入“气体影响”类别。这是因为“供液不足”“气液影响油层出砂”和“气体影响”都表现为右下方面积的缺失，只是“气液影响油层出砂”在上下冲程中，出现砂卡的波动比“供液不足”大；“供液不足”在下冲程卸载的过程中，卸载线较“气体影响”的卸载线陡而直[23]，因此容易混淆。通过分析混淆矩阵可知本文搭建的模型是合理的。

图11 诊断结果的混淆矩阵Fig.11 Confusion matrix of diagnosis results

综上所述，本文搭建的基于LeNet 的CNN 模型（LeNet 2）在大多数工况下具有较高的识别准确度，满足抽油机工况检测的诊断精度要求。并且本文通过混淆矩阵对搭建的模型（LeNet 1 和LeNet 2）进行了可视化分析，证明了所搭建的模型是合理的。

4 工程应用

用基于LeNet 模型的油井抽油机工况诊断方法构建抽油机井工况智能监控预警系统，该系统逻辑框图如图12 所示。由图12 可知，一方面，该系统能对示功图的识别结果进行实时判断，当出现井下故障时，能通过生成实时预警报告的方式指导油井监控人员进行故障处理；另一方面，该系统能对示功图的识别结果进行论证，使得该系统始终处于更新、学习以及强化的过程。通过该系统能够在一定程度上解决因抽油机井故障引起的油田减产、停产等现象，对油田的高效生产具有重要意义。

图12 工况智能监控预警系统逻辑框图Fig.12 Logical block diagram of working condition intelligent monitoring and early warning system

5 结论

1）基于LeNet 的CNN 模型考虑了抽油机常见的15 种井下工况，且搭建的模型在验证集上对于工况识别的准确度为94.68%，具有较高的工况诊断精度。

2）在搭建模型的过程中引入了Dropout 层防止模型过拟合，引入了LRN 层提高模型的泛化能力，进而提高了网络模型的收敛速度以及识别精度。

3）对输入到CNN 模型的示功图数据进行归一化、二值化以及细化处理，避免噪声影响的同时利于模型的训练。此外，将不同抽油机的示功图和同一抽油机不同时段的示功图放入同一模型框架中进行自动识别，表明该模型具有通用性。

4）基于LeNet 的CNN 模型经过训练后具有较强的泛化能力，从而使得该模型对新的示功图样本具有较强的适应性，进而保证对新的示功图样本的识别精度。本文研究为基于工况诊断的卷积神经网络模型的搭建提供了一种新的思路，对于智慧油田建设具有重要意义。

符号说明