基于图像分割+SVM 的微观剩余油类型自动识别*

2023-12-09 08:50于晓圆庄子浩孙琛皓焦守龙
计算机与数字工程 2023年9期
关键词:薄片含油形态学

于晓圆 庄子浩 孙琛皓 焦守龙

(中国石油大学(华东) 青岛 266580)

1 引言

随着世界经济的发展和油气资源开发深度的增加,世界石油可采储量不断减少,能源形势越来越严峻。目前,国内大部分油田的主力油藏都已进入中后期开发阶段,受地下地质认知及技术等多种因素的制约,总体采收率不高,剩余油的总量较大,剩余油研究已成为勘探开发研究的一个重点。

剩余油是指对于已经开发过的油藏或油田中还存有尚未采出的石油。剩余油研究是油田开发规划部署及提高采收率的基础,根据国内外研究现状,可将剩余油的研究技术分为宏观规模和微观规模。由于油田企业的直接需求,对于剩余油的研究多侧重于宏观方面,对微观剩余油的研究相对较少,而大部分剩余油都残留于储层微观孔隙中,所以目前对于储层微观孔隙中剩余油分布的研究也非常重要。

近年来,随着油气储层研究的持续发展,用于研究微观孔隙内剩余油的研究手段和实验方法也在不断创新,如激光共聚焦技术、核磁共振成像技术、微观仿真模型技术和含油荧光薄片技术[3]等。朱九成等[4]利用高速成像技术研究多孔介质中指进现象及剩余油分布特征。Ruzyla[5]设计了定量的图像分析系统,来对储层内的孔隙空间特征进行表征。李中锋[6]利用微观渗流仿真模拟技术和图像处理技术,通过进行水驱油物理实验,观察剩余油的形成与分布。Guo[7]采用纳米CT 和图像分析,可以表征页岩储层内真实的孔隙分布和有机质含量。含油荧光薄片技术具有实验制作简便、成本较低等优势,而且能够直观、真实地反映油藏孔隙中剩余油原始微观分布特征,是众多油田研究不同储层微观剩余油空间分布最常用的技术。利用含油荧光薄片图像进行微观剩余油识别,通常通过传统技术来研究剩余油的形成和分布,以往储层中微观孔隙剩余油的量化过程大多依靠人工经验,评判标准具有主观性,且在多张图像中对剩余油标注并分类的工作量极大。随着现代科技的迅猛发展,特别是图像处理、机器学习等计算机新技术的发展为微观剩余油研究带来了新的思路。本文利用计算机图像处理技术和分类识别技术通过对岩心含油荧光薄片图像进行智能分析,获得剩余油的微观认识,可以对剩余油开发提供支持。

2 本文方法

2.1 预处理:形态学梯度重建

在所拍摄的含油荧光薄片图像中,由于噪声点等干扰因素的存在,直接进行图像分割容易造成过分割,因此在图像分割前需要对其进行预处理。在形态学中,结构元素是最基本的概念。用B、F分别表示结构元素和所需要进行操作的图像,⊝为腐蚀运算,⊕为膨胀运算,对于像素空间中的每一个像素点(x,y),腐蚀运算E 和膨胀运算D 操作定义如式(1)、(2):

形态学开重建操作是先对原始含油荧光薄片图像进行腐蚀运算,然后对所得到的图像进行膨胀运算。形态学开重建操作可以用来平滑含油荧光薄片图像中较大目标物体的边界同时不改变其面积,定义形态学开重建为

形态学闭重建操作是先对原始含油荧光薄片图像进行膨胀运算,然后对所得到的图像进行腐蚀运算。形态学闭重建操作能够填充含油荧光薄片图像中目标物体内部孔洞连接邻近区域并平滑边界,定义形态学闭重建为

其中“◦”、“·”分别表示形态学开重建和形态学闭重建操作。由于噪声点等干扰因素可能位于图像分割目标的上方或下方,使用单一的开重建或闭重建操作,只能消除分割目标上方或下方的噪声点,会导致目标信息的位置发生偏移,而构建形态学开闭重建运算,既能使目标轮廓信息位置不变,又能消除含油荧光薄片图像中的细节噪声,达到预处理的目的。

2.2 分割:分水岭算法

分水岭分割算法的原理主要是通过图像中的海拔高度来计算集水盆之间的边界,从而达到分割区域的效果。海拔高度由灰度值的大小决定,灰度值越高,那么海拔高度也就越高,同理,灰度值越小,其海拔高度也越低。因此该算法可通过寻找待分割图像各灰度值的局部极小值,以此为中心寻找其附近的影响区域,这一影响区域即为集水盆,当集水盆的范围确定以后,就能够进一步确定集水盆与集水盆之间的边界,集水盆之间的边界则称之为分水岭。分水岭分割算法从一个较低但是能够有效分割目标的阈值开始,随着阈值的增大,使分割效果达到最优,且相邻目标不会被合并为同一区域,可以有效地解决由于目标区域相邻较近而不能用全局阈值进行精确分割的问题。

分水岭算法的具体步骤如下:

1)首先计算图像G中每个像素的灰度值,并将灰度值进行排序,如果灰度值相同,那设定像素点均为同一个层级。

2)处理一个层级ℎcur(即当前层级)的所有像素点,如果某一像素G(x,y)的邻域像素已经被标记,则将G(x,y)加入到先进先出的队列Q中。

3)如果当前队列Q不为空,根据FIFO原则,取出队首元素作为当前所要处理的像素。设第一个出队元素为G(x',y'),检查G(x',y')所在邻域内的其它像素,如果其邻域内的像素灰度值与G(x',y')属于同一层级,即灰度值相等,那么按照邻域像素的标记来更新G(x',y')。一直进行此步骤直到队列Q内没有元素可取。

4)再次检查当前灰度值所在层级的其它像素,如果还存在没有进行标记的像素点,说明该像素是一个新的极小区域,将该像素的区域标记值进行加1 处理,然后以该像素为起点再次循环步骤3),直到再也检查不到其他极小区域为止。

5)返回步骤2),继续去处理ℎcur+1的所有像素点,直至将所有层级的像素处理完毕。

2.3 后处理:区域合并

经过基于形态学梯度重建的分水岭分割算法处理后,含油荧光薄片图像的过分割现象已经大大减少,但在较大的目标区域还会存在部分过分割,产生这一现象的主要原因是由于输入的含油荧光薄片图像中各像素值相近且邻近区域极小,因此不能有效地标记出含油荧光薄片图像中相同类别的区域。所以,需要对分割后的含油荧光薄片图像进行后处理,即区域合并。

区域合并的基本思想是提取各子区域的区域图像特征,并基于各子区域的综合特征相似度进行合并,从而得到属于同一类别的分割区域。在区域合并中,需要一些描述符来表示初始分割的区域的特征并定义对应的区域合并基准,具体如下。

纹理特征相似性:采用LBP特征直方图来表示子区域的纹理特征,定义表示子区域Ri内所有像素点LBP 值的直方图,定义两个子区域Ri和Rj之间的纹理特征相似性为TS(i,j),计算公式如式(5):

颜色特征相似性:采用颜色直方图来表示子区域的颜色特征,定义表示子区域Ri在RGB颜色空间中的颜色直方图。定义两个子区域Ri和Rj之间的颜色特征相似性为CF(i,j),计算公式如式(6):

邻接黏度:定义邻接黏度为两个子区域之间邻接像素点的数量。若两个子区域之间邻接像素点较多,则说明这两个区域邻接黏度大。定义AE(i,j)表示子区域Ri和Rj之间邻接黏度,计算公式见式(7),当AE(i,j)数值越大时,表示两个子区域之间邻接像素点越多,则进行区域合并的可能性也越大。

区域合并代价:定义R表示合并过程中所有子区域的集合,Cost(Ri,Rj)表示两个子区域合并的代价函数,本文采用区域邻接图RAG 来表示各子区域之间的相邻接关系,每个顶点代表一个子区域,边表示与邻近子区域相连,边的权重表示两个顶点合并的代价。假设两个子区域不属于同一类别,这两个子区域特征通常会存在较大差异,其进行区域合并的代价也越大。代价函数与纹理特征相似性和颜色特征相似性成正比,与邻接黏度成反比,因此定义区域合并代价计算公式如式(8)所示。

于是,得到区域合并的算法步骤如下:

1)首先提取每一个子区域的颜色特征、纹理特征,并计算其与邻近子区域的邻接黏度;

2)将分割后的子区域集合R转换为区域邻接图RAG;

3)计算合并代价。如果任意两个相邻子区域Ri和Rj满足合并代价Cost(Ri,Rj),则将子区域Ri和Rj合并为同一区域,并在RAG 中删除连接Ri和Rj的边;

4)重复步骤3)直至所有相邻子区域都不满足合并代价Cost(Ri,Rj),则合并过程结束。

2.4 分类和识别

分类识别是针对应用问题,通过有监督或无监督的机器学习建立分类识别模型,然后对任意给定的问题对象,输入到模型后,能得到正确的分类识别结果。本文研究的岩心荧光薄片图像,需要识别和分类出岩心微观上的矿物颗粒等,因此采用SVM作为分类器,提取其颜色作为区域特征。通过计算子区域中各像素颜色值的组成分布来表示该子区域的颜色特征,假设s(xi)为图像中某一特定颜色xi的像素个数,则xi像素出现的频率见式(9),出现频率最高的xi像素即为该区域的颜色特征。

将提取后的颜色特征输入到分类器中进行分类和识别,采用SVM+高斯(RBF)核函数对分割后的含油荧光薄片图像进行分类,对于任意两个子区域特征向量的相似度计算公式见式(10):

B表示训练集样本特征向量,C表示测试集样本特征向量,bi、ci分别表示B、C特征向量中的元素,T表示特征向量的维数。s(B,C)的值越小,表示两个子区域的相似度越高,可以将其归为一类。

3 实验及结果分析

3.1 实验数据

本文的实验数据为拍摄的岩心含油荧光薄片图像,部分采集的原始图像如图1所示。

图1 原始含油荧光薄片图像

3.2 实验及结果分析

利用拍摄的岩心荧光薄片图像对本文提出的处理流程和方法进行实验验证。

3.2.1 预处理及分割实验

对原始含油荧光薄片图像进行图像分割,首先对含油荧光薄片图像进行形态学梯度重建,再进行分水岭分割,实验结果见图2,其中图(a)是原始图像,图(b)是直接对图像进行分水岭分割的结果,图(c)是进行形态学梯度重建后再进行分水岭分割的结果。

图2 分水岭分割算法

从图2 可以看出,直接对原始含油荧光薄片图像进行分水岭分割,对于颜色相近的区域,会产生许多细小的分割区域,造成严重的过分割现象。而先对含油荧光薄片图像进行形态学开闭重建运算,分割后的图像目标轮廓会较为清晰,可以减少过分割。

3.2.2 后处理实验

从上节图2 可以看到,在对含油荧光薄片图像进行分割后,对于较大目标区域的过分割问题还没有得到彻底解决,所以需要对其进行后处理,即区域合并。采用本文的方法对分割后的图像进行后处理,实验结果如图3,其中图(a)是区域合并前分割图像,图(b)是区域合并后分割图像。

从图3 可以看出,经过后处理后,较大目标区域的过分割问题得到明显改善,分割更合理准确(见框出部分)。

3.2.3 识别分类实验

为了验证本文提出的剩余油类型自动识别方法的有效性和准确性,将经过本文方法进行分割后的图像输入到本文所采用的SVM 模型,进行剩余油类型分类识别实验,同时,与KNN 模型的分类识别进行了对比实验,实验结果如图4,其中图(a)是人工分类识别结果,图(b)是KNN 模型识别分类结果,图(c)是SVM模型识别分类结果。

图4 人工分类识别与机器分类识别

从图4 中可以看出,使用机器分类识别的结果要优于人工分类的结果,且利用KNN 分类器进行分类时,对于颜色特征较为相近的区域,都会将其误分类为同一组分,图4(b)框选区域被误分类为矿物颗粒,而使用SVM 分类器则不会出现这种误分类情况。因此,在进行含油荧光薄片图像的组分分类时,SVM分类器要优于KNN分类器。

4 结语

本文采用基于形态学梯度重建与分水岭算法相结合的图像分割算法对含油荧光薄片图像进行分割,为了使分割出的区域更合理,在区域合并时引入纹理特征相似性、颜色特征相似性和邻接黏度等指标刻画区域特征,最后通过提取合并后的子区域的颜色特征来对各区域成分信息进行识别分类,成功地将矿物颗粒分割出来。实验结果表明,该方法通过对岩心的微观智能分析,实现了对剩余油分布特征的深入认知和解释,为剩余油研究提高采收率提供支撑。

猜你喜欢
薄片含油形态学
来自森林的植物薄片
你真好
你真好
BAF组合工艺处理含油废水研究进展
医学微观形态学在教学改革中的应用分析
酸调质—氧化降解法提高含油污泥的沉降性能
铁路含油污泥焚烧的特性
NY3菌固定化及生物膜处理含油废水的研究
数学形态学滤波器在转子失衡识别中的应用
巨核细胞数量及形态学改变在四种类型MPN中的诊断价值