基于L1范数主成分分析网络的肝功能分级方法

2023-12-23 06:01张正言黄炜嘉奚彩萍张惠惠
关键词:肝功能分级准确率

张正言,黄炜嘉,奚彩萍,杨 魏,张惠惠

(1.江苏科技大学 海洋学院, 镇江 212100) (2.江苏科技大学 自动化学院,镇江 212100) (3.江苏省人民医院 介入科, 南京 210029)

在临床肝脏疾病的诊疗过程中,肝功能分级对于外科手术指征的精准把握、内科治疗方案的个性化选择以及患者预后的监测与评估都有着重要的意义[1].现阶段,临床实践中最具代表性的肝功能分级方法主要有Child-Turcotte-Pugh (CTP)分级和终末期肝病模型(model for end-stage liver disease,MELD)分级[2].然而,这些分级方法主要依赖于患者在空腹下静脉采集的血液学检查的生物化学指标,具有创伤性,且存在时效性不足等问题.

借助于常规超声、计算机断层扫描(computed tomography,CT)和磁共振成像(magnetic resonance imaging,MRI)等医学影像,结合人工智能技术对肝脏疾病的研究逐步成为了研究热点[3].CT图像能较好地反映肝脏的病理形态,已成为了诊断肝脏疾病首选的成像方法之一[4-5].文献[6]为了突出肝脏CT图像中邻域像素点之间的关系,提出了一种多尺度LBP图像特征提取算法,实现了高阶尺度采样点与其邻域相关点之间的信息融合,从而提高肝脏病变检测的准确率.文献[7]开发了基于肝脏增强CT图像的深度学习系统,对肝脏纤维化进行分期,并对该系统的分期准确性进行了验证.文献[8]设计了一种多尺度深度特征提取的分类网络模型,实现了对肝脏肿瘤的精确分类.尽管这些方法主要侧重分析异常肝组织和正常肝组织之间的差别,通过诊断患者的肝脏是否发生病变来间接对肝功能进行评估分级,然而,其显示出了CT图像与肝脏病理组织之间具有一定的关联性,使得利用肝脏CT图像特征直接对肝功能进行分级成为可能.文献[9]对肝脏CT图像提取多尺度方向数值模式特征,并利用支持向量机对肝功能进行分级.对于不同于肝脏正常、异常组织的分析与识别,用于肝功能分级的肝脏病理组织具有类内差异大,类间差异小等特点,且人眼无法分辨.

目前,主成分分析网络(principal component analysis network,PCANet)应用在医学图像的多个领域,其网络结构简单,在训练样本有限的情况下取得了较好的分类效果[10-12].然而,该网络模型存在不足:① 使用基于L2范数的主成分分析(principal component analysis,PCA)方法来学习网络中各层卷积核的参数,容易受到离群数据以及噪声的影响;② 网络提取的特征维度过高,易造成信息的冗余,在一定程度上限制了模型的性能.

因此,文中提出一种基于L1范数主成分分析网络(L1-norm principal component analysis network,L1-PCANet)的肝功能分级方法,利用L1范数主成分分析(L1-norm principal component analysis,L1-PCA)[13]算法改进网络中卷积核参数的学习方法,进而提取出CT图像中肝脏感兴趣区域(region of interest,ROI)的深度层级特征,并在网络的输出层引入等距特征映射(isometric feature mapping,Isomap)[14]对特征进行非线性降维,去除冗余信息,最后,利用支持向量机(support vector machine,SVM)对模型进行优化训练,进而实现肝功能分级.

1 实验数据

1.1 数据获取

文中实验数据来自2017-2019年期间38位肝病患者在江苏省人民医院就医时的检查数据,数据包含每位患者的门诊信息、腹部CT影像、诊断的病因信息以及同期采集到的血液学检查指标,如生化全套检查数据、凝血五项检查数据等.

1.2 数据集的构建

首先,将每位患者的检查数据按照MELD计算评分,即:

R=3.8×ln[胆红素(mg/dl)]+11.2×ln(INR)+
9.6×ln[肌酐(mg/dl)]+6.4×(病因)

(1)

式中:“病因”选项中,胆汁淤积性或酒精性为0,其他为1;INR为凝血酶原时间国际标准化比值.MELD评分R值越高,提示预后越差,生存率越低.然后,根据评分R值,进一步将肝功能划分为3个等级:“低危”(R<15)、“中危”(15≤R≤18)和“高危”(R>18),并将这3个等级作为患者CT影像数据样本的标签.

图1给出了部分患者“低危”等级的腹部CT图像,患者1和患者2的MELD评分R=5,患者3和患者4的MELD评分R=14.从图中可以看出,对于肝功能等级相同的不同患者,即使MELD评分R相同,但由于患者的个体因素,其腹部CT图像中的肝脏部位仍呈现出较大的差异性.

图1 相同肝功能等级的CT图像

为了减小这种类内差异对肝功能分级的影响,由医生提取不包含血管和肿瘤等明显差异的肝脏ROI图像,其大小为38×38像素,如图2.

图2 不同肝功能等级的肝脏ROI图像

随后,将ROI图像作为实验数据集中的数据样本,按照其MELD评分R与标签“低危”、“中危”和“高危”相对应,从而构建肝功能分级数据集.

2 方法

文中提出了一种基于L1-PCANet的肝功能分级方法,其算法流程如图3.

图3 L1-PCANet的算法流程

2.1 L1-PCA算法

假设输入的图像样本为X=[x1,x2,…,xN]∈RD×N,其中,N为样本的数量,D为样本的特征维数.L1-PCA的目标是最大化特征空间中基于L1范数的方差,求解由W*张成的K(K

s.t.WTW=IK

(2)

式中:‖·‖1为L1范数;W=[w1,w2,…,wK]∈RD×M为投影矩阵,wk(k=1,2,…,K)为K维线性子空间的基;IK为K×K的单位阵,约束条件WTW=IK保证投影矩阵的正交性.

考虑到求解K>1时的全局最优解较为困难,可将其转换为求解序列K=1的最优化问题,即:

s. t. ‖w‖2=1

(3)

式中:‖·‖2为L2范数.连续使用K次贪婪算法求出式(3)的最优解即可近似表示式(2)的解,具体算法如下:

step1 初始化w(单位向量);

step2 对于所有的i∈[1, 2, …,N],如果wTxi≥0,则Si=1,否则Si=-1;

通过上述算法可得到第一个主成分所对应的投影向量w1,为了计算wk(k>1),可通过更新训练数据循环迭代计算,即:

(4)

2.2 基于L1-PCANet的肝功能分级方法

2.2.1 输入层

(5)

通过对所有N个训练样本图像进行上述操作,并级联在一起,作为网络的输入矩阵:

(6)

2.2.2 卷积层

(7)

式中:matk,k(·)表示将投影向量通过映射转换成一个卷积核.

(8)

式中:*表示卷积运算;i=1, 2, …,N;l1=1, 2,…,L1.

对于第一个卷积层输出的L1×N个图像,再次将输入的图像进行采样块向量化、去均值和级联操作,得到第二阶段的输入矩阵为:

(9)

(10)

式中:l=1, 2, …,L2.

(11)

式中:*表示卷积运算;i=1,2,…,N;l1=1, 2, …,L1;l2=1, 2, …,L2.

通过重复上述类似操作,可将网络结构扩展为具有更多卷积层的深度网络结构.

2.2.3 输出层

(1) 二进制哈希编码

在第二层卷积之后,每个样本图像Ii有L1组映射矩阵,且每组包含有L2个映射矩阵.对每组的L2个映射矩阵图像进行二进制哈希编码,即:

(12)

(2) 直方图统计

(13)

(3) 特征降维

为了解决提取出的深度层级特征维数过高的问题,采用流形学习中的Isomap算法[14]对特征进行全局非线性降维,降低特征的维度,去除冗余信息.

Isomap算法是一种全局非线性的流形学习方法,其目的就是将高维数据空间RD中的数据样本映射到低维流形空间Rd(d≤D)中,得到低维嵌入数据集合的非线性降维.具体算法如下:

step 1 根据样本的欧式距离矩阵D构建邻域图G;

step 2 根据邻域图,计算任意两点的最短距离近似作为两点间的测地距离矩阵DG;

step 3 使用多维尺度(multidimensional scaling,MDS)算法对最短距离矩阵DG构造d维嵌入.

(4) SVM分类

使用SVM分类器对肝功能分级模型进行优化训练,其优化目标为:

s.t.yi[wTφ(xi)+b]≥1

(14)

式中:w为法向量;φ表示输入空间到特征空间的非线性映射;yi为样本标签;b为位移量.

3 实验结果与分析

3.1 实验设置

数据集共有882个数据样本,其中,“低危”、“中危”和“高危”3个类别分别有697个,93个和92个,其统计结果如表1.

表1 肝功能分级数据集统计结果

考虑到表1中实验数据集数据分布的不均衡性以及“中危”等级对应的MELD评分R值的区间范围(15≤R≤18)过小的问题,结合临床过程中肝功能分级辅助诊断的实际需求,将“中危”与“高危”两个等级合并,共185个样本,同时,随机选取200个“低危”等级的样本,进而将分级问题转化为对“低危”、“中高危”两个等级的二分类问题.

3.2 评价指标

采用准确率(Accuracy)、查准率(Precision)、查全率(Recall)以及F1值等性能指标对实验结果进行定量分析,计算公式为:

(15)

(16)

(17)

(18)

式中:TP、TN、FP、FN分别为真正例、假正例、真反例、假反例对应的样本数量.

3.3 实验结果

通过实验分别讨论不同的网络模型参数对分级准确率的影响.网络模型参数主要包括卷积层中卷积核的个数L1、L2,输入层中采样块的大小k1、k2,输出层中直方图分块的大小q1、q2.

3.3.1 不同卷积核个数的实验结果

对每个卷积层中的卷积核个数的选择进行实验.相关参数设置为:k1=k2=5,q1=q2=5,降维后的特征维数d=10.首先,考虑只有一个卷积层的L1-PCANet(L1-PCANet-1),并对卷积核个数由2~16依次进行遍历;然后,考虑具有两个卷积层的L1-PCANet(L1-PCANet-2),对卷积核个数由4~20进行遍历;最后,对3个卷积层的L1-PCANet(L1-PCANet-3)中卷积核的个数依次遍历4~16.

对于L1-PCANet-1,当L1≥4时,其分级准确率高于PCANet-1,如图4;对于L1-PCANet-2,卷积层数的增加使得分级准确率相对于L1-PCANet-1提高了,同时在卷积核数量相同的情况下,L1-PCANet-2分级准确率均高于PCANet-2,如图5;对于L1-PCANet-3,由于肝脏ROI图像样本数量少,类间差异小,卷积层数的进一步增加使其网络的拓扑结构更为复杂,导致准确率相对于L1-PCANet-2反而下降了,如图6.文中最终选择具有两个卷积层的网络模型结构,且卷积核个数为L1=L2=8.

图4 L1-PCANet-1的实验结果

图5 L1-PCANet-2的实验结果

图6 L1-PCANet-3的实验结果

3.3.2 不同采样块大小的实验结果

在网络模型中,采样块的大小直接决定了卷积核的模板大小,分别对3×3、5×5、7×7、9×9和11×11大小的采样块进行实验,相关参数设置为:L1=L2=8,q1=q2=5,降维后的特征维数d=10.实验结果如图7.可以看出,文中提出的改进模型L1-PCANet的分级准确率整体上高于原始PCANet模型.当采样块大小大于5×5之后,两者的分级准确率都呈现下降趋势.通过实验,最终选择采样块的大小为k1=k2=5.

图7 不同采样块大小的实验结果

3.3.3 不同直方图分块大小的实验结果

直方图的分块大小决定了网络提取的深度层级特征的维度,对输出层的直方图分块大小从1×1到10×10进行实验,相关参数设置为:L1=L2=8,k1=k2=5,降维后的特征维数d=10.实验结果如图8.直方图从整体上反映了图像的统计特性,过大的分块会导致图像细节的丢失,过小的分块会造成特征的冗余,使得特征维度过大.通过实验,选取直方图的分块大小为q1=q2=5.

图8 不同直方图分块大小的实验结果

3.3.4 不同特征维数下的实验结果

为了验证Isomap非线性降维方法的有效性,分别将深度特征降维到1~50维进行实验,结果如图9.从图中可以看出,当特征维数d=10时,分级准确率达到最高,随着维数的增大,分级准确率有所下降,随后趋于平缓.

图9 不同特征维数的实验结果

3.3.5 不同影像组学特征模型的实验结果对比

将文中提出的L1-PCANet模型与原始PCANet等不同影像组学特征模型进行对比实验,结果如表2.加粗字体表示各列最优结果.

表2 不同特征模型交叉验证下的性能指标均值

从实验结果可知,文中方法的分级准确率、查准率、查全率和F1值分别达到78.67%、78.1%、87.33%和0.824 6,相对于原始PCANet模型分别提高了5.81%、2.73%、9.33%和5.8%.由此可见,改进的网络模型利用多层卷积网络提取出肝脏ROI图像中更具鉴别力的层级特征,有效地提高了肝功能分级的准确性.

4 结论

为了解决现有肝功能分级存在创伤性,且存在时效性不足等问题,从肝脏CT图像入手,提出了一种基于L1范数主成分分析网络的肝功能分级方法,利用L1-PCA算法学习网络中卷积核参数,从而提取出CT图像中ROI的深度层级特征,并通过Isomap对特征进行非线性降维,进一步去除冗余信息,最后,利用SVM实现对肝功能分级.通过大量实验得出以下结论:

(1) 利用了L1-PCA方法改进原始PCANet中卷积核的参数的学习方法,加强对离群数据和噪声的鲁棒性,从而提取出肝脏CT图像中更具鉴别力、鲁棒性更强的深度层级特征.

(2) 使用基于流形学习的Isomap算法对提取到的深度层级特征进行非线性降维,去除冗余信息,进一步增强特征的有效性和区分度.

(3) 相比于现有的方法,文中方法切实提高了肝功能分级的准确率、查准率、查全率以及F1值等性能指标.

(4) 该方法通过CT无创检查获取患者的肝脏图像来实现肝功能分级,避免了血液检查需要空腹等限制,因此,具有无创性、高效性和可重复性,能够为临床医生对患者的肝功能提供及时、有效地辅助诊断.

猜你喜欢
肝功能分级准确率
重视肝功能正常的慢性HBV感染者
肝功能报告单解读
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
高速公路车牌识别标识站准确率验证法
分级诊疗路难行?
分级诊疗的“分”与“整”
分级诊疗的强、引、合
“水到渠成”的分级诊疗