一种新策略的肺结节检测算法

2016-08-12 05:48汶德胜
电子学报 2016年6期
关键词:高斯灰度聚类

邱 实,汶德胜,冯 筠,崔 莹

(1.中国科学院西安光学精密机械研究所,陕西西安 710119;2.中国科学院大学,北京 100049;3.西北大学信息科学与技术学院,陕西西安 710127;4.武警工程大学装备工程学院,陕西西安 710086)



一种新策略的肺结节检测算法

邱实1,2,汶德胜1,冯筠3,崔莹4

(1.中国科学院西安光学精密机械研究所,陕西西安 710119;2.中国科学院大学,北京 100049;3.西北大学信息科学与技术学院,陕西西安 710127;4.武警工程大学装备工程学院,陕西西安 710086)

针对计算机在肺部CT肺结节辅助检测过程中,二维CT图像序列血管横截面与肺结节成像特征类似,导致无法有效检测的问题,提出新策略的肺结节检测算法.以格式塔心理学为基础,以去除血管的新策略间接的对肺结节进行检测.实验结果表明,本算法可有效降低血管对肺结节检测的影响,从而提高肺结节的检测精度.

格式塔原理;血管;肺结节

1 引言

肺结节是肺癌的早期形态,随着时间的推移部分肺结节发生恶性病变(血管粘连、体积变大等)转化为肺癌,严重威胁着人类的健康.对其早发现早治疗会大幅度降低发展为肺癌的可能性.所以肺结节的准确诊断是非常重要.目前观察肺部主要是通过计算机断层扫描产生数以百计的高分辨率图像CT图像序列,而肺结节仅占极少图片的极小区域,如果仅凭医生肉眼识别肺结节,工作量大并且容易漏诊误诊.所以通过借助于计算机对肺结节辅助检测是当前研究的热点.又因为肺结节是类似球型的区域(一般直径1~15mm),在肺部二维CT图像中呈现局部高亮、高密度的类圆形型区域,与血管横断面成像特征相似.无法有效区分,所以准确提取肺结节也是当前研究的难点.

目前,肺结节检测算法主要思路集中在从肺结节的角度进行分割、特征提取.Nie S和刘慧等[1,2]利用二维模糊聚类的方法根据灰度差异,提取感兴趣区域(ROI,Region Of Interest),根据肺结节特征进行判断,确定肺结节区域.Chen N[3]根据肺结节在二维CT上是类圆形的形态特征,建立二维模型对结节区域进行提取.以上算法仅从二维的角度,利用结节特征进行分析,无法抑制血管对其检测的干扰,导致假阳高.El-Baz A[4]等根据肺结节在三维类球型特征,选取种子点三维生长.可以区分血管和肺结节的区域,假阳相比二维检测大幅度降低,但仅能检测出孤立的肺结节,对血管粘连型肺结节无法检测.综上所述,血管是肺结节检测的主要干扰,单从肺结节特征角度无法有效区分血管和结节.而血管具有贯穿性、连续性等特征可以用于区分.所以本文从血管角度进行分析和去除血管,实现肺结节更好的检测.

2 本文算法

2.1格式塔原理

格式塔心理学派研究表明:人们看到物体是眼、脑共同作用的结果,不是单独看待每一个个体,而是将其整体考虑,眼睛通过人脑将各个单位按照某种关系整合、简化,使之变为知觉上易于处理的整体.

根据格式塔原理,首先对肺部CT图像序列去噪、提取肺实质等预处理,将肺部与背景区分开,图像序列初步简化;然后通过优化的高斯双模型对图像分割,得到ROI(包含肺结节、血管等),图像序列再次简化;再根据格式塔连续性、整合性原则,对轴位CT图像序列建立各向同性数据体,滤除大量血管ROI;最后精确提取结节ROI,根据分类性,利用结节特征判别得到结节区域并标注.

2.2优化的高斯双模型

目前肺结节检测的主流算法大部分需对图像序列进行分割提取ROI.主要有Reeves A P[5]通过经验设定固定阈值进行分割.OTSU法[6]通过统像素点分布关系进行分割.McIntosh C[7]以肺部空间形态进行分割.Ray Liu[8]等人提出高斯混合模型算法,用多个高斯模型的加权求和来模拟实际情况,能在一定程度上对噪声进行抑制.

根据文献[9],肺部CT主要包含椒盐噪声,中值滤波可很好的去除.通过试验肺部CT图像灰度分布数据统计(如图2),从空间角度肺部大部分为气体组织,小部分为血管和肺结节组成.从灰度角度气体组织和血管、肺结节存在着差异,分布曲线类似两个高斯曲线叠加(如图3).综合考虑肺部空间特征和CT图像特征,本文采用高斯双模型算法来拟合高斯曲线,以两个高斯模型交汇处为分割阈值实现分割.高斯混合模型分布函数如下:

(1)

(2)

其中M是高斯混合模型的混合数,pi是混合系数,x是灰度值,p(x|λ)是高斯混合密度,λ完整参数集,bi(x)是单个高斯密度分布函数.μi和σi是高斯密度分布函数的参数.

期望最大化(Expectation Maximization,EM)算法可确定参数pi、μi和σi.该算法由Dempster,Laird和Rubin提出,用于不完全数据集进行最大似然估计的算法.此算法需对图像每个像素点进行迭代运算,运算量大、效率低.

根据肺部CT值分布在有限的灰度级范围,并且区域与区域之间有着一定的差异,在此基础上,我们对其求解过程进行优化.以肺部CT灰度级为单位进行统计,公式优化如下:

(3)

(4)

(5)

(6)

其中灰度级总数G,N为图像处理的像素总数,m为迭代的次数,h(x)为像素值为x时对应像素点的数量.

由于采用CT灰度级代替灰度值统计,导致分割阈值与最优的分割阈值存在一定的差异,对于灰度相似的交界点上分割效果有些影响,但速度上已有了很大提高.

2.3血管特征提取

通过优化的高斯双模型分割得到大量ROI(血管、结节等)区域.在ROI中许多血管横断面与结节断面的形态和灰度值及其相似,无法从二维图像对血管和结节区分,而且依据肺结节特征对于血管粘连的肺结节检测难度大.根据格式塔整合原理:血管具有连续性、贯穿性、圆柱型结构等特点,可从血管角度对血管进行整合间接解决此问题.

在CT图像序列中,需增强血管区域,抑制其他区域.目前最有效最常见的算法均是基于Hessian矩阵的.其特征值的滤波器可突出强化血管连续性、圆柱型结构.Hessian矩阵由图像f(x)中体素P点的二阶偏导组成.矩阵公式如下:

(7)

由于肺部具有各向同性,即从任意方向观察体素包含的性质是相同的.而CT断层扫描层间距和图像分辨率不一致,要对其进行内插修正才能反映肺部真实情况.在此,综合周边像素值和计算量的影响,采用线性插值对像素值修正(如图6)公式如下,其中G为插值点坐标,IZ、Px分别为轴位图像层厚和像素间距,其二者不相等时,按照如下算法差值,相等时,不插值.

(8)

以修正后的像素值为基准构建Hessian矩阵,其构建过程参考文献[12],计算3个特征值λ1,λ2,λ3(满足|λ1|≤|λ2|≤|λ3|)和特征向量ν1,ν2,ν3,代表不同方向运动趋势,如图7所示.对于血管这样的管状结构,在CT图像中呈现高亮区域,沿血管方向局部灰度变化不大,而剖面方向变化剧烈,则满足|λ3|≈|λ2|>>|λ1|≈0.

以Hessian矩阵为基础,衍生出Lorenz[10]、Sato[11]和Frangi[12]构造的经典滤波器结构.后续Jinzhu Yang等[13~15]在以上三种滤波器基础上针对不同类型的血管从速度和性能上进行优化,都起到了较好的效果.本文对比三种经典滤波器,最终选择Frangi滤波器,充分利用Hessian矩阵三个特征值抑制噪声,在不影响肺结节检测的基础上对肺部血管增强.Frangi滤波器是在Hessian基础上引入比例系数R1区分平面结构和管形结构,R2用于识别球形结构,S用于去除噪声,α,β用于控制R1,R2和S的灵敏度,本文中选取α,β为0.5.实现血管的增强并对结节抑制,为后续肺结节检测做铺垫.

(9)

(10)

(11)

利用式(9)对图像进行滤波,因为肺部图像中血管、结节等腔体仅占小部分区域,而这些区域绝大部分都在提取后的ROI中.若采用Frangi滤波器直接对所有图像序列像素点进行滤波,耗时多,效率低.可在提取后的ROI基础上进行滤波,在不影响检测效果的同时快速对血管增强.

2.4肺结节区域提取

通过Frangi滤波,血管区域增强,肺结节区域被抑制.但根据血管粗细、灰度值强弱不一致,导致增强的程度也不一样,所以单阈值无法准确区分血管和结节.而血管区域的像素值应为局部较大值,可根据各ROI特征矢量间距离进行聚类.近年来,对聚类的研究包括:C均值聚类[1,16],最小生成树[17],线性判别聚类[18]等算法.其中模糊C均值聚类算法(Fuzzy C Means clustering,FCM)是目前应用最为广泛的图像分割算法.它将模糊性应用到像素隶属判断,符合人类感知特性、便于实现等优点.刘慧[1]等对FCM算法进行改进,并成功应用到肺结节检测方面.抑制噪声,提取肺结节.本文按照文献[1]算法先对滤波后的ROI进行聚类,血管区域的像素点予以去除.然后将剩余的ROI对应原图像素点区域再次聚类(主要针对血管粘连的恶性肺结节的分割),得到疑似肺结节ROI.由于运算区域相比整幅图像大幅度降低,使迭代次数下降,运算速度快.

以图像学特征和医学特征出发,选取四组共计64维影像特征[19],对肺结节ROI进行检测,最终得到肺结节区域进行标注.

3 实验及结果分析

实验采用International Early Lung Cancer Action Project[20]和美国肺影像数据库协会[21]数据库50套肺部CT数据和2014年13套医院直接采集的肺部CT数据.以2名专业医师对血管进行标注,对于肺结节(直径2-5mm)采用独立盲法标记作为检测依据(金标准).

3.1图像分割

本文提出的优化双高斯混合模型算法与OTSU法、空间信息算法、传统高斯双模型算法分割结果与医师标注的血管、肺结节比较.使用面积交迭度[22](Area Overlap Measure,AOM)衡量分割效果的评价指标,定义为:

(12)

其中AOM是面积交迭度,A为标准图像,B为分割结果图像,S(·)表示对应区域的像素点数,AOM值越大表明分割效果越好.

根据表1,优化高斯双模型算法综合考虑像素值与肺部数据的空间特点,AOM优于文献[6,7]算法,但采用灰度级代替灰度值使得分割效果略低于传统高斯双模型算法,但运算速度大幅度下降,可用于临床使用.优化高斯双模型在分割效果上略低于传统高斯双模型算法.通过分析图像可知,对于灰度值较暗血管末梢或者肺结节,由于集中在分割点附近,而优化算法得出的阈值在小范围内存在一定的偏差,导致分割效果略低.

表1 算法效果对比表

3.2血管增强效果比较

目前主流血管增强滤波器均是在Lorenz、Sato和Frangi算法基础上改进而成.对于不同类型的血管数据检测效果不同.

为验证检测肺部血管有效性,选取来自不同扫描时间、不同层厚、层间距的30条具有典型性的肺部血管(直径1~10mm)进行滤波增强.在各向同性优化Hessian矩阵基础上,对比三种滤波器在参数最优的条件下的性能,引入响应面积(Response Area,RArea)衡量滤波器响应范围;响应衰减率(Response decay rate,DRate,能量衰减到原来70%所需距离)来衡量滤波器响应的灵敏度(图8).两者均越小越好.

根据图9、10分析:Frangi滤波器利用三个特征值抑制噪声,综合考虑血管形状,增强效果好.Lorenz滤波器仅选用部分特征值,导致相似结构区别表达弱;Sato滤波器对特征值大小直接排序,对于血管表达式不唯一,对于不同粗细血管适应性不强.

3.3肺结节检测效果

对比LDA[18]和FCM[1]算法将提取特征后的ROI区域进行分类的结果,利用肺结节的特征64维判别.引入ROC性能指标:ROC曲线下面积(Area Under Curve,AUC)来评价检测结果和分类器性能.FCM算法充分考虑空间分布关系,如图11可知FCM算法AUC大于LDA算法,因此本文采用FCM[1]算法.

3.4算法显示效果

如表2所示,本文提出算法对于孤立、肺壁相连、血管粘连的肺结节均可以检测到.主要流程为:(1)CT图像序列,经过优化的高斯双模型分割得到包含血管、肺结节等高亮的ROI.(2)疑似血管区域增强,聚类得到血管ROI,对应原图去除.(3)不是血管ROI进行聚类、边界修补(主要针对血管粘连的恶性肺结节),得到修补的结节ROI,通过肺结节特征进行判别并标注.最终显示肺结节的三维图形.

表2算法效果图

4 总结

文章针对计算机检测肺结节假阳高,血管和肺结节不能有效区分的问题.以格式塔心理学为基础,提出根据血管的判别间接对肺结节检测的新策略,通过临床试验,能够检测肺结节,排除了大量血管的干扰,准确度高,但对于面积小、灰度值低的肺结节的检测,需要后续进一步研究.

[1]刘慧,张彩明,邓凯,等.改进局部自适应的快速FCM肺结节分割方法[J].计算机辅助设计与图形学学报,2014,26(10):1727-1736.

Liu Hui,Zhang Caiming,Deng Kai,et al.Research on fast FCM pulmonary nodule segmentation algorithm using improved self-adaption[J].Journal of Computer-Aided Design & Computer Graphics,2014,26(10):1727-1736.(in Chinese)

[2]Nie S,Li L,Wang Y,et al.A segmentation method for sub-solid pulmonary nodules based on fuzzy c-means clustering[A].2012 5th International Conference on Biomedical Engineering and Informatics (BMEI)[C].Chongqing,PRC:IEEE,2012.169-172.

[3]Chen N,Liu G,Liao Y,et al.Research on computer-aided diagnosis of lung nodule[A].2014 IEEE Workshop on Electronics,Computer and Applications (IWECA)[C].Ottawa ON:IEEE,2014.1019-1022

[4]El-Baz A,Elnakib A,Abou El-Ghar M,et al.Automatic detection of 2D and 3D lung nodules in chest spiral CT scans[J].International Journal of Biomedical Imaging,2013,11(10):1751-1762

[5]Reeves A P,Chan A B,Yankelevitz D F,et al.On measuring the change in size of pulmonary nodules[J].IEEE Transactions on Medical Imaging,2006,25(4):435-450.

[6]吴成茂.基于后验概率熵的正则化 Otsu 阈值法[J].电子学报,2013,41(12):2474-2478.

Wu Chengmao.Regularization Otsu’s thresholding method based on probability entropy [J].Acta Electonica Sinica,2013,41(12):2474-2478.(in Chinese)

[7]McIntosh C,Hamarneh G.Medial-based deformable models in nonconvex shape-spaces for medical image segmentation[J].IEEE Transactions on Medical Imaging,2012,31(1):33-50.

[8]Huai Li,Yue Wang,K J Ray Liu,et al.Computerized radiographic mass detection—Part I:Lesion site selection by morphological enhancement and contextual segmentation [J].IEEE Transactions on Medical Images,2001,20(4):289~301.

[9]郭薇,魏颖,周翰逊,等.基于混合分类的肺结节检测算法[J].东北大学学报 (自然科学版),2008,29(11):1528-1531.

Guo Wei,Wei Ying,Wei Hanxun,et al.A detection algorithm based on hybrid classification for pulmonary nodules[J].Journal of Northeastern University( Natural Science),2008,29(11):1528-1531.(in Chinese)

[10]Lorenz C,Carlsen I C,Buzug T M,et al.Multi-scale line segmentation with automatic estimation of width,contrast and tangential direction in 2D and 3D medical images[A].CVRMed-MRCAS'97[C].Grenoble,France:Springer Berlin Heidelberg,1997.233-242.

[11]Sato Y,Nakajima S,Shiraga N,et al.Three-dimensional multi-scale line filter for segmentation and visualization of curvilinear structures in medical images[J].Medical Image Analysis,1998,2(2):143-168.

[12]Frangi A F,Niessen W J,Vincken K L,et al.Multiscale vessel enhancement filtering[A].Medical Image Computing and Computer-Assisted Interventation-MICCAI’98[C].Cambridge MA,USA:Springer Berlin Heidelberg,1998.130-137.

[13]Yang J,Ma S,Sun Q,et al.Improved Hessian multiscale enhancement filter[J].Bio-medical Materials and Engineering,2014,24(6):3267-3275.

[14]Kumar R P,Albregtsen F,Reimers M,et al.3D multiscale vessel enhancement based centerline extraction of blood vessels[A].Medical Imaging 2013:Imaging Processing,2013[C].Lake Buena Vista (Orlando Area),Florida,USA:SPIE,2013.

[15]陈瑞,孙静宇,林喜荣,等.利用多光谱图像的伪造虹膜检测算法[J].电子学报,2011,39(3):710-713.

Chen Rui,Sun Jing yu,Lin Xirong,et al.An algorithm for fake lrises detection using multi-spectral images [J].Acta Electonica Sinica,2011,39(3):710-713.(in Chinese)

[16]蒋亦樟,邓赵红,王骏,等.熵加权多视角协同划分模糊聚类算法[J].软件学报,2014,25(10):2293-2311.

Jiang Yizhang,Deng Zhaohong,Wang Jun,et al.Collaborative partition multi-view fuzzy clustering algorithm using entropy weighting[J].Journal of Software,2014,25(10):2293-2311.(in Chinese)

[17]李翔宇,王开军,等.基于网格最小生成树的聚类算法选择[J].模式识别与人工智能,2013,26(1):34-41.

Li Xiangyu,Wang Kaijun,et al.Selection of clustering algorithms based on Grid-MST[J].Pattern Recognition and Artificial Intelligence,2013,26(1):34-41.(in Chinese)

[18]汝佳,陈莉,房鼎益.一种LDA和聚类融合的SVM多类分类方法[J].西北大学学报(自然科学版),2014,44(4):559-562.

Ru Jia,Chen Li,Fang Dingyi.SVM multi-class classification based on LDA and clustering[J].Journal of Northwest University ( Natural Science),2014,44(4):559-562.(in Chinese)

[19]陈胜,李莉.一种全新的基于胸片计算机辅助检测肺结节方案[J].电子学报,2010,38(5):1211-1216.

Cheng Sheng,Li Li.A new computer aided diagnostic scheme for lung nodule detection on chest radiographs[J].Acta Electonica Sinica,2010,38(5):1211~1216.(in Chinese)

[20]VIA/I-ELCAP.International Early Lung Cancer Action Project[DB/OL].http://www.via.cornell.edu/lungdb.html,2014-03-01

[21]Armato III S G,McLennan G,Bidaut L,et al.The lung image database consortium (LIDC) and image database resource initiative (IDRI):A completed reference database of lung nodules on CT scans[J].Medical Physics,2011,38(2):915-931.

[22]孙锐,陈军,高隽.基于显著性检测与 HOG-NMF 特征的快速行人检测方法[J].电子与信息学报,2013,35(8):1921-1926.

Sun Rui,Chen Jun,Gao Jun.Fast pedestrian detection based on saliency detection and HOG-NMF features.[J] Journal of Electronics & Information Technology,2013,35(8):1921-1926.(in Chinese)

邱实男,1986年生,助理研究员,博士研究生,研究方向:图像处理、模式识别.

E-mail:qiushi215@163.com

汶德胜男,1965年生,研究员,博士生导师.主要研究方向为光电成像技术,电子技术,图像处理等.

E-mail:ven@opt.ac.cn

冯筠女,1972年生,教授,博士生导师.研究方向:智能信息处理,机器学习,医学影像分析.

E-mail:fengjun@nwu.edu.cn

崔莹女,1981年生,讲师,博士研究生.研究方向:光学系统设计,图像处理.

E-mail:cuiying@opt.cn

A New Strategy Lung Nodules Detection Algorithm

QIU Shi1,2,WEN De-sheng1,FENG Jun3,CUI Ying4

(1.Xi’anInstituteofOpticsandPrecisionMechanicsofCAS,Xi’an,Shaanxi710119,China;2.UniversityofChineseAcademyofSciences;Beijing100049,China;3.SchoolofInformationScienceandTechnologyEngineering,NorthwesternUniversity;Xi’an,Shaanxi710127,China;4.CollegeofEquipmentEngineering,EngineeringUniversityofChineseArmedPoliceForce,Xi’an,Shaanxi710086,China)

When lung nodules are detected in lung CT by computers,the vessel cross section and lung nodule have similar imaging characteristics in the two-dimensional CT image sequence,resulting in unable to detect problems precisely.We employed a new strategy for the lung nodules detection algorithm,which is based on the Gestalt psychology.This method can detect lung nodules indirectly by removing blood vessels.The experimental results show that,this algorithm can effectively reduce the influence of blood vessels on lung nodule detection,so as to improve the accuracy of detection of lung nodules.

Gestalt principles;blood;lung nodules

2014-12-19;修回日期:2015-07-27;责任编辑:梅志强

国家自然科学基金(No.61372046);陕西省自然科学基金(No.2014JM8338)

TP391.41

A

0372-2112 (2016)06-1413-07

猜你喜欢
高斯灰度聚类
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于K-means聚类的车-地无线通信场强研究
数学王子高斯
天才数学家——高斯
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于高斯混合聚类的阵列干涉SAR三维成像
基于灰度线性建模的亚像素图像抖动量计算
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法