基于影像组学和自动机器学习的PA患者肾上腺静脉取血结果的研究

2024-03-05 08:55谢薇陈涛罗国婷王寒箫舒炀刘娟郑涛孙怀强
中国医疗设备 2024年2期
关键词:组学纹理分类器

谢薇,陈涛,罗国婷,c,王寒箫,舒炀,刘娟,郑涛,孙怀强,c

四川大学华西医院 a.放射科;b.内分泌代谢科;c.临床磁共振研究中心;d.信息中心,四川 成都 610041

引言

原发性醛固酮增多症(Primary Aldosteronism,PA)是目前最常见的可治愈的高血压病因之一[1],占高血压患者的5%~11%,在顽固性高血压患者中患病率较高,接近17%~23%[2-5]。过量的醛固酮可能来源于单侧或双侧肾上腺,单侧肾上腺最常见的病因是醛固酮瘤(Aldosterone Producing Adenoma,APA);双侧多为双侧肾上腺增生(Bilateral Adrenal Hyperplasia,BAH),也称为特发性醛固酮增多症,占所有病例的50%以上。目前,APA 可通过单侧肾上腺切除术治疗,而BAH 患者通常需要终身用药[6]。因此,确诊为PA 后对患者进一步分型诊断具有重要的临床意义。PA 的分型诊断一直是临床上的难点,在很大程度上影响了治疗方案的选择。根据美国内分泌学会临床实践指南推荐,确诊PA 后的患者需行肾上腺CT 检查排除占位性病变,并进行初步分型诊断。但肾上腺CT 扫描容易漏诊直径小于5 mm 的微小腺瘤[7]和结节样增生,也无法区分无功能腺瘤和APA。根据国际指南推荐,肾上腺静脉取血(Adrenal Venous Sampling,AVS)是目前PA 分型诊断的金标准[8],其敏感度和特异性均可达90%以上,明显优于CT。但AVS也有一些缺点:具有一定的创伤性,技术上具有挑战性,检查结果难以解释,并且面临肾上腺静脉破裂的风险[9]。

影像组学是指从医学图像中高通量地提取基于靶组织或器官的形状、一阶和纹理等组学特征[10-11],从而将医学图像转换为可挖掘的数值特征的研究方法[9,12-13]。前期研究已表明基于CT 图像的影像组学特征在肾上腺相关疾病的诊断和预后预测中有一定辅助价值。例如,He等[14]使用非增强CT 图像进行了影像组学分析,发现特定的影像组学特征(包括一阶和纹理特征)结合临床因素构建的模型有助于预测单侧肾上腺瘤患者中APA发生的风险,并可用于辅助临床决策;Akai 等[15]研究发现,从肾上腺平扫CT 图像中提取的影像组学特征与PA 患者肾上腺醛固酮的分泌状态存在相关性,可为预测PA 定位提供帮助;Ahmed 等[16]研究发现,术前增强CT 图像的影像组学特征在预测肾上腺皮质癌患者的Ki-67 表达方面表现出较好的结果,其中在Ki-67 高表达组中,形状特征的受试者工作特征(Receiver Operating Characteristic,ROC)曲线下面积(Area Under Curve,AUC)、敏感度、特异性分别为0.78、80%、69.2%,同时检测到影像组学特征与Ki-67 的表达存在显著相关性。

受前期研究启发,本研究拟采用肾上腺CT 影像组学特征对PA 患者的AVS 结果进行预测,以期开发一种术前无创辅助鉴别PA 亚型的方法。

1 资料与方法

1.1 一般资料

选取2017年10月至2021年3月在四川大学华西医院住院,且临床资料符合纳入标准的确诊PA 并成功行AVS 的357 例患者为研究对象。纳入PA 的诊断依据为内分泌学会的临床实践指南标准[17]。AVS 需在没有促皮质素的刺激下进行穿刺置管,并采用2.0 或更高的选择性指数确定插管是否成功。分侧指数≥2.0 为优势侧PA,分侧指数<2.0 为无醛固酮分泌优势侧。根据午夜血清皮质醇和/或1 mg 地塞米松(国药准字:H33020822,规格:0.75 mg)过夜抑制试验的结果,排除自主分泌皮质醇的患者。其中共有45 例患者因以下原因被排除:① CT 图像质量差(n=12);② CT 图像层厚超过1 mm(n=29);③ 无CT 图像(n=3);④ 合并其他肾上腺肿瘤(n=1)。最终,312 例患者[207 例单侧PA(AVS-右∶AVS-左=93 ∶114),105 例AVS-双侧PA]纳入本研究。研究经本院伦理委员会审批通过(批准文号:2021-1611)。

1.2 图像数据

本研究纳入的CT 图像数据采集自4 个厂家的7 种机型。图像采集均由符合资质的扫描技师完成,扫描技师每天对机器进行空校以保证图像质量,且每个患者均进行3 期扫描(平扫、动脉期和静脉期)。CT 机型和扫描参数详细情况如表1所示。

表1 CT扫描参数

1.3 研究流程

1.3.1 肾上腺分割

肾上腺分割在薄层静脉期图像上进行,为了确保分割结果的一致性,肾上腺分割采用本课题组前期研发的基于深度神经网络的肾上腺自动分割模型[18]。为提高分割效率,该模型采用了两段式分割:第一阶段从整个腹部CT 图像中定位双侧肾上腺位置,并分别提取出包含左右肾上腺的子区域;第二阶段使用小器官分割模型,以便更准确地分割肾上腺边界。图像的分割评价指标主要有戴斯相似系数(Dice Similariy Coefficient,DSC)、体积相关误差(Relative Volume Error,RVE)、豪斯多夫距离( Hausdorff Distance,HD95)。DSC 是医学图像处理领域常用的分割效果评估指标,通过计算两个样本的相似度或重叠度,评估分割效果,DSC 值越接近1,提示分割精度越好。HD95 主要是用来度量边界的分割准确度。前期实验表明,该模型在验证数据上对肾上腺的自动分割取得DSC 值为0.8742±0.0588,RVE 值为0.1271±0.1383,HD95 值为2.89±3.90[18]。虽然前期结果表明,利用该模型自动生成的肾上腺分割已经非常接近人工勾画的金标准,但为了确保分割的准确性,本研究将自动生成的肾上腺标签叠加到原始CT 图像上,并分别由2 名具有10年和8年腹部影像系统诊断经验的高年资医师进一步检查以控制质量。结果显示,无论是DSC 值,还是图像直观观察对比,本研究采用的基于深度神经网络的肾上腺自动分割模型均具有较高的分割精度,保证了纹理特征提取的准确性。如图1所示为2 例代表性病例及其肾上腺自动分割结果。

图1 2例代表性病例静脉期正交三视图及相应肾上腺分割

1.3.2 影像组学特征提取

影像组学特征提取采用基于Python 语言的开源软件包PyRadiomics 3.0,在静脉期CT 薄层图像中分割出的肾上腺区域内进行计算。本研究从肾上腺内提取了3 组特征[19-20],其中包括14 个形状特征、18 个一阶影像组学特征和73 个纹理特征。计算纹理特征前先对图像信号强度进行离散化,本研究采用了固定bin 宽度(宽度为5)的离散化方式[21],最终纳入了以下类别的纹理特征:22 个灰度共生矩阵、16 个灰度大小区域矩阵(Gray Level Size Zone Matrix,GLSZM)、16 个灰度运行长度矩阵(Gray Level Run Length Matrix,GLRLM)、5 个相邻灰度差矩阵和14 个灰度依赖矩阵(Gray Level Dependence Matrix,GLDM)。除了提取原始CT 图像中的纹理特征,本研究还进一步对原始图像进行了多种滤波,并在滤波后图像的肾上腺内再次提取多尺度纹理特征。采用的滤波器包括拉普拉斯-高斯(Laplacian of Gaussian,LOG)滤波器(滤波核尺寸分别设为1、2、3、4、5 mm)和小波(Wavelet)滤波器(包含HHH、HHL、HLH、HLL、LHH、LHL、LLH 和LLL 共8 个不同方向的高低通滤波核)。最后,从每个肾上腺中共提取出1288 个[14 个形状特征+(18 个一阶影像组学特征+73 个纹理特征)×(1+5+8)]影像组学特征。

1.3.3 数据均一化

本研究纳入的CT 图像数据采集自7 种不同的机型,有研究表明,影像组学特征对机器型号、采集参数和重建参数较敏感,机器型号、采集参数和重建参数的异质性会导致特征偏倚。为了提高数据统计能力和模型稳定性,在建模前,研究采用了Combat 算法对特征进行均一化处理[22-23]。ComBat 算法基于估计参数的先验分布,改善分布的平均值和标准差的一致性,可消除不同机型之间技术性差异的同时,保留影像组学特征的生物性差异。如图2所示为使用Combat 算法将CT 机型作为批次效应对代表性纹理特征进行均一化前后的分布可视化。通过比较均一化前后的两个代表性纹理特征分布可得,在进行均一化之前,同一个纹理特征在不同机型之间分布差异较大,而均一化后分布趋于一致。

图2 2个代表性影像组学特征均一化前后的分布变化

1.3.4 自动机器学习

预测模型的训练和验证采用开源自动机器学习框架Pycaret,该框架可对机器学习中的数据预处理、建模算法选择和模型超参数调节等步骤实现全自动优化。

为避免个体特征维度过高,同时考察图像滤波后的纹理特征对预测的贡献,本研究将提取的形状特征、一阶影像组学特征、纹理特征分为7 个子集并分别输入分类算法:① 原始图像组(Original);② LOG 滤波图像组;③ Wavelet 滤波图像组;④ Original+LOG 滤波图像组+Wavelet 滤波图像组;⑤ Original+LOG 滤波图像组;⑥ Original+Wavelet 滤波图像组;⑦ LOG 滤波图像组+Wavelet 滤波图像组。

为进一步降低个体特征维度,本研究将左右肾上腺的特征向量逐元素相除得到一个新的特征向量,称为商值特征向量。在自动机器学习流程中,全部数据按7 ∶3的比例随机分为训练集(218 例)和测试集(94 例)。自动机器学习算法迭代采用十折交叉验证和TPE(Treestructured Parzen Estimator)搜索策略在训练集上搜索最优的分类算法和相应的超参数。分类算法池中预置了13 种常用分类器:① 随机森林分类器;② 极度随机树分类器;③ 梯度提升分类器;④ 轻量级梯度提升分类器;⑤ 自适应增强分类器;⑥ 朴素贝叶斯;⑦ 支持向量机;⑧ 决策树分类器;⑨ 逻辑回归;⑩ 线性判别分析;⑪岭回归分类器;⑫K 近邻分类器;⑬二次判别分析。最优算法和超参数确定后,在此配置下重新训练整个训练集数据得到最终预测模型,再在测试集上对模型性能进行评估。本研究采用准确度、AUC、召回率等度量参数评估模型性能,研究流程如图3所示。

图3 研究流程图

2 结果

2.1 患者人口学特征

本研究共纳入3 1 2 例经AV S 确诊的PA 患者。其中2 0 7 例诊断为单侧优势PA(AV S-右∶AV S-左=9 3 ∶1 1 4),1 0 5 例诊断为双侧优势PA。右侧优势、左侧优势和双侧优势组的平均年龄分别为(4 8.9 5±1 0.1 9)岁 (1 7 ~7 2 岁)、(48.39±10.52)岁(25~76岁)和(48.16±10.9)岁(1 9 ~7 6 岁)。3 组间年龄(P=0.8 6 8)、性别(P=0.937)差异均无统计学意义。

2.2 Pycaret中的分类模型

经过模型比较,在Original 特征子集上训练的随机森林分类器获得了最优性能。其中准确度为0.7500,召回率为0.7466,AUC 为0.8792。ROC 展示了随机森林分类器模型的预测性能,见图4。各个特征子集的最佳模型性能如表2所示。

图4 最优模型(Original特征子集上训练的随机森林分类器)对3个亚型鉴别能力的ROC曲线

表2 各个特征子集的最佳模型性能

2.3 对分类有显著贡献的特征

根据最优模型结果,在模型训练过程中可得到每个输入特征的重要性。预测能力最强的前10 个特征如图5所示,包括1 个形状特征(表面积与体积的比率)、1 个一阶统计特征(能源)、8 个纹理特征。纹理特征包括GLRLM、GLDM、GLSZM。GLRLM 提供了关于具有相同灰度级的连续像素在一个或多个方向上的空间分布信息,GLDM 为依赖于中心体素的特定距离内连接体素的数量,GLSZM 为具有相同灰度强度的连接体素的数量。形状特征中的表面积体积比值越小,形状越紧密;值越大,表面突起越多,边缘越毛糙,预示着肾上腺形态的改变和PA 分型有着紧密的联系。纹理特征值可以反映病灶内部信号强度的异质性,一阶特征用于描述各体素信号强度值的分布情况,表明各PA 亚型之间纹理及灰度分布等方面具有较大差异。以上进一步说明了医学图像的影像组学分析可通过描述肿瘤空间中的体素排列反映肿瘤的异质性。

图5 在Original特征子集上的随机森林分类器预测能力最强的前10个特征

3 讨论

本研究探讨了基于影像组学特征结合自动机器学习在预测PA 患者AVS 结果方面的有效性。其中,在Original 特征子集上训练的随机森林分类器预测性能最优,其准确度、AUC、召回率分别为0.7500、0.8792、0.7466。结果表明,基于CT 图像的影像组学特征结合最优性能分类器在预测AVS 结果方面有一定潜力。

机器学习是现代临床数据分析的关键技术,放射学中机器学习的目标是开发一个模型来识别图像中的特征,并通过将该特征与预测目标联系起来从而帮助诊断和预后。常规的机器学习流程是首先选择一个最适合任务数据的建模算法,再确定一个超参数的组合,使性能最优化。算法的性能因机器学习的目标和数据集的不同而不同,现有的影像组学研究根据算法的偏好或流行程度选择机器学习管道,所用的算法和超参数值往往对模型错误率的影响超过40%[24]。由于任务的复杂性限制了非机器学习领域专家的学习,本研究使用了自动机器学习框架Pycaret,Pycaret 可自动进行数据预处理、算法选择以及超参数的调整。

从CT 图像上进行肾上腺的分割是影像组学工作流程中至关重要的一步,分割的准确性会对后续特征的提取产生影响从而影响模型性能。在常规临床实践中,通常由具有良好专业知识和丰富经验的人员进行手动分割,但该过程非常耗时,手工勾画1 例患者的双侧肾上腺平均需要2.5 h,且不同人员勾画的结果也存在一定差异。此外,肾上腺在形态和位置上的差异,以及与周围组织的模糊边界,使得肾上腺分割难度增加[25]。为了节省人力,提高图像分割的可重复性,本研究使用了团队以往工作中提出的一种两阶段深度神经网络,以端到端的方式自动分割肾上腺,平均每个患者只需36 s。与人工分割相比,该方法不仅提高了分割效率,同时保证了分割的客观性。该自动分割系统可从CT 薄层图像中准确分割出肾上腺,可作为临床实践中基于医学图像的人工智能辅助诊断工具。

本研究纳入的CT 图像数据采集自7 个不同的机型。为了减小机型、采集参数和重建参数差异导致的数据异质性[26],建立更加稳定的模型,研究使用了Combat 算法对提取的影像组学特征进行了均一化处理。

值得注意的是,在Original 特征子集上,随机森林分类器预测性能最优,其性能优于LOG 和Wavelet 子集中的模型。LOG 滤波是一种能有效抑制噪声、平滑图像的方法,该方法对于去除噪声引起的图像异质性和突出生物学上的重要异质性非常重要,在图像降噪中得到了广泛的应用[27-29]。模型中LOG 和Wavelet 特征组准确度较低的一个可能原因是去除图像背景噪声的同时损失了部分图像信号。

根据特征重要性图分布,形状特征在预测AVS 的结果中起着重要的作用。形状特征可以描述肿瘤的物理外观、坚固程度、表面不规则度和偏心度。偏心度描述了肿瘤的伸长程度及其偏离规则圆形的程度[28],值越低表示形状越紧凑(球形),较高的表面-容积比表明更多的周边组织浸润,这一结论与之前的研究结果一致[29],即与双侧优势的患者相比,左侧优势的患者的左-右-肾上腺-体积比的平均值更大,右侧优势患者的左-右-肾上腺-体积比的平均值更小。在最佳模型对预测能力有显著贡献的10 个特征中,有7 个来自于纹理特征,包括GLDM 和GLRLM。GLRLM 主要测量具有相同强度的体素线的分布,而GLDM 则量化图像中的灰度依赖关系,测量在一定距离内依赖于中心体素的连接体素的数量。CT 纹理分析可通过评估灰度分布帮助量化肿瘤的异质性。

本研究也存在一定的局限性。① 由于回顾性研究的性质,使本研究可能存在一些偏倚分析,但本研究重复了10 倍交叉验证,以避免过拟合并减少偏倚;② 纳入样本量(n=312)相对较小,所有患者均来自单一中心,虽然交叉验证用于模型评估,但在具有不同成像设备和参数的多中心数据集中,模型可能表现不同,未来可以纳入外部数据集以进行进一步的模型验证;③ 由于患者随访时间不同,且很多病例随访信息不足,影像组学特征未与临床结果相关联,未来可尝试逐步加入更多的临床指标,以临床和影像纹理特征相结合的方法提高三分类的预测准确性;④ 由于研究的回顾性性质,本文只使用了静脉期增强CT 图像的影像组学的常规特征,未来可以开展前瞻性研究,并分析基于双能量CT 扫描的图像特征,探索其能否进一步提高模型的预测能力。未来在研究中还可纳入来自不同机构的多中心大规模数据,尝试利用深度学习的方法提高模型的稳定性和鉴别能力。

4 结论

影像组学结合自动机器学习可以预测PA 患者的AVS 结果,且具有较高的准确性。该方法有望成为有创检查的替代方法,并为PA 患者的术前诊断和临床决策提供帮助。

猜你喜欢
组学纹理分类器
基于BM3D的复杂纹理区域图像去噪
口腔代谢组学研究
使用纹理叠加添加艺术画特效
BP-GA光照分类器在车道线识别中的应用
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
TEXTURE ON TEXTURE质地上的纹理
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
消除凹凸纹理有妙招!
代谢组学在多囊卵巢综合征中的应用