基于改进K-Means聚类的视频感兴趣区域提取算法

2021-11-24 22:55刘南锋

科学与生活 2021年18期

刘南锋

摘要：针对传统K-Means聚类算法对图像分割时受初始聚类数目设定对像素点进行分类存在聚类不准确、对聚类中心依赖性较强的问题和无法区分感兴趣区域（Region of Interest，ROI）和非感兴趣区域（Non Region of Interest，NROI）的弊端，提出一种基于改进K-Means聚类的视频感兴趣区域提取算法。首先，该算法根据视觉关注机制分别确定当前帧视频图像中运动剧烈区域的最小纹理复杂度和信息熵与运动平缓区域的最大纹理复杂度和信息熵;然后基于K-Means聚类思想随机选取k个初始聚类中心，并采用设计的聚类规则对像素点进行迭代分类，最后对分类后的各个聚类集合根据运动剧烈区域与运动平缓区域的纹理复杂度和信息熵进行区域分类，最终确定该视频帧的感兴趣区域和非感兴趣区域，完成视频感兴趣区域的提取。消除传统K-Means聚类算法对图像分割时分类不准确和鲁棒性弱的问题，并提取出视频的感兴趣区域。

关键词：K-Means聚类;感兴趣区域;非感兴趣区域;纹理复杂度;信息熵

0引言

随着计算机视觉领域的发展，图像处理在医疗、军事、电力等行业迅猛发展，而图像分割作为图像处理的基础手段在计算机视觉中发挥着重要作用[1]。人眼视觉关注机制表明[2]，人眼对于视频帧不同区域具有不同的关注度，对于运动剧烈的区域，即感兴趣区域更易引起人眼关注;而对于运动平缓区域，即非感兴趣区域关注度较低;目前针对视频帧的分割目的在于区别视频帧中不同运动剧烈程度的区域，而忽略了基于人眼视觉关注机制对于图像的分割。因此，基于人眼视觉关注机制对视频帧进行分割将成为图像分割领域研究的热点问题[3]。

为适应技术发展的要求，国内外学者提出很多图像分割算法，传统图像分割算法主要包括基于阈值的分割方法[4]、基于区域的分割方法、基于特定理论的分割方法和基于聚类的分割方法。

1 算法分析

1.1 K-Means聚类算法

K-Means聚类算法是聚类分割领域的经典算法，该类算法是一种迭代求解的聚类分析方法，算法是将抽象对象的集合根据相似特征分类为多个类的过程，其目的是最小化对数据点和簇中心之间的紧密性及逆行采样的目标函数。算法具体步骤为：

（1）初始随机选择k个对象像素点，每个对象代表一个簇的中心，这里需要提前知道预知类的数量，即簇的数目。

（2）计算每个像素点距离簇中心的距离，并将距离簇中心距离近的像素点归类到该簇中。

（3）经过步骤（2）得到每个簇的初始聚类结果，对每个簇计算所有像素点距离中心点距离的均值，以该均值点作为该簇的中心点，继续执行步骤（2）

（4）重复步骤（2）和步骤（3），直到满足迭代次数或每个簇的中心点满足给定阈值内变化，完成算法迭代，实现像素点的聚类。

从上述步骤可看出该算法易实现，且算法效率较高;但该算法受初始聚类数目和聚类中心选定的影响，会影响聚类结果的精度。

2 基于改进K-Means聚类的视频感兴趣区域提取

针对K-Means聚类算法受初始聚类数目和聚类中心影响导致聚类结果不精确的问题，本文基于视觉关注机制对K-Means聚类算法进行优化并采用提出的聚类规则对视频进行聚类分割，提取出视频感兴趣区域。算法实现步骤如下：

（1）人眼视觉关注机制表明，均值绝对偏差（）可很好表征图像的纹理复杂度，本文采用作为衡量图像纹理特性的依据;同时信息熵可很好表征数据的混乱程度，这里采用信息熵作为衡量图像运动剧烈程度的依据;对于纹理复杂度高的区域，图像运动剧烈程度较大，则图像中像素点的运动方向混乱程度较高，则该区域的信息熵较大;而对于运动平缓区域，该区域像素点运动方向呈规律性变化，则该区域的信息熵较小。基于此，本文选取和作为像素剧烈的判断依据。首先计算當前视频处理帧运动剧烈区域的最小纹理复杂度和最小信息熵，运动平缓区域的最大纹理复杂度和最小信息熵。

（2）这里随机选取k个聚类中心，将不受原K-Means聚类算法对类数目的限制，并对每个类以类中心为圆心，1像素为半径步长向外扩张，每次扩张前将计算当前聚类中心圆的，同时，将计算连续三次聚类时的值，并采用如下设计聚类规则进行聚类分析：

式中：表示当前类和下一次聚类得到的差值; 表示运动剧烈区域差值的最小值; 表示当前类和下一次类的信息熵的差值; 表示连续两次迭代信息熵的差值; 表示当前点为运动剧烈区域和运动平缓区域边界点; 表示当前点位于运动平缓区域; 表示当前点位于运动剧烈区域; 表示当前类不在向外扩张; 表示当前类继续向外扩张; 表示连续三次聚类的相邻两次差值均处于增加状态，其他三种符号以此类推; 表示以当前类为中心的圆结束扩张。

（3）重复步骤（2），直至遍历所有像素点，完成所有像素的遍历。

（4）根据公式（2）进行ROI和NROI的划分。

式中：表示当前类的。综上，即可完成视频帧ROI和NROI的划分，实现视频感兴趣区域的提取。

3实验结果分析

3.1实验参数与评价指标

为验证本文算法的有效性，在硬件配置为：Inter（R） Core（TM） i7-10510U，主频为2.3GHz，内存为16GB;软件配置为：Microsoft Visual Studio 2010和OPENCV2.4.10的实验平台进行实验仿真。

3.2 实验结果分析

本文基于改进K-Means聚类进行视频感兴趣区域提取算法相较于传统基于阈值分割算法、基于区域分割算法和基于特定理论分割算法可提取精度更高的分割区域;同时，本文设计的聚类规则可克服传统K-Means聚类算法依赖初始聚类数目和聚类中心的影响，对不同图像的鲁棒性更高，并分割出效果更佳的图像区域。同时本文算法基于视觉关注机制采用均值绝对偏差和信息熵作为提取视频感兴趣区域的判定依据，可使输出视频帧更符合人眼视觉关注机制。综上，本文基于改进K-Means聚类进行视频感兴趣区域提取算法可在克服原有K-Means聚类算法不足的基础上基于视觉关注机制提取更符合人眼视觉关注机制的视频感兴趣区域。

本文算法目的时消除现有K-Means聚类算法的不足，并基于K-Means聚类算法提出一种视频感兴趣区域提取算法。

4 结论

本文提出一种基于改进K-Means聚类的视频感兴趣区域提取算法，该算法首先基于视觉关注机制分别确定当前处理帧的运动剧烈区域最小纹理复杂度和信息熵与运动平缓区域的最大纹理复杂度和信息熵;然后，采用设计的聚类规则对当前视频帧进行聚类，得到最后的聚类集合;最后，基于运动剧烈和运动平缓区域的纹理复杂度和信息熵的关系确定当前视频帧的感兴趣区域和非感兴趣区域，最终提取视频感兴趣区域。本文算法可很好克服现有K-Means聚类算法的不足，并获得精度更高，更符合人眼视觉关注机制的视频感兴趣区域。

参考文献：

[1]杨宇，崔陶.基于深度学习和水平集的彩色图像分割方法（英文）[J/OL].四川大学学报（自然科学版），2021，4（4）：1-12.

[2]危水根，王程伟，陈震，张聪炫，张晓雨.基于视觉注意机制的红外弱小目标检测[J].光子学报，2021，50（01）：181-195..

[3]刘侠，余鸿波，李冰，王波.基于改进U-Net模型下的椎骨CT图像分割方法[J/OL].哈尔滨理工大学学报，2021，4（03）：58-64.

[4]余博文.数字图像阈值分割研究与应用[J].科学技术创新，2021，4（19）：91-92.