单域泛化X-ray乳腺肿瘤检测

2024-03-20 10:32史彩娟郑远帆任弼娟孔凡跃段昌钰
中国图象图形学报 2024年3期
关键词:实例特征性能

史彩娟,郑远帆,任弼娟,孔凡跃,段昌钰

1.华北理工大学人工智能学院,唐山 063210;2.河北省工业智能感知重点实验室,唐山 063210

0 引言

乳腺肿瘤成为女性患者中常见的癌症类型。在临床实践中,乳腺肿瘤的病症诊断主要由专业医疗从业人员完成,但由于病灶小及腺体组织的遮挡等,使得人工产生假阴性诊断(Marmot 等,2013),从而使患者错过最佳治疗时间。现有很多研究使用医学影像辅助诊断技术(computer-aided diagnosis,CAD)对乳腺肿瘤病灶进行检测(Zhang 等,2022a;Kolchev等,2022;Aly 等,2021;Ibrokhimov 和Kang,2022)。此外,基于双模态的乳腺分类方法(赵绪 等,2022)增强模型对噪声样本的抑制能力来提升分类精度,基于语义拉普拉斯金字塔的乳腺肿瘤分割模型(王黎 等,2021)有效融合不同尺度的语义特征来提升肿瘤的分割精度。现有的大部分方法是基于全监督学习,首先将医学图像中的肿瘤人工标记出来,然后将标记的数据送入模型进行训练。然而,人工标记肿瘤工作量巨大,且依赖医生的临床经验,使得现有标注数据稀少,不能很好地满足全监督学习的需要。

另外,由于噪声影响,图像数据分布存在不可知的域偏移,如图1 所示,不能满足全监督场景下训练数据与测试数据分布一致的要求,导致基于全监督范式下的目标检测模型性能受损(Chen等,2018)。

图1 域偏移数据分布Fig.1 Data distribution of domain shift

目前缓解域偏移的方法主要有两种,即域自适应方法(Li等,2020)和域泛化方法(Li等,2019)。域自适应方法的源域和目标域设定如图2 所示,其中源域为正常天气下的城市街道场景,目标域为雾天下的城市街道场景。近年域自适应目标检测方法不断涌现(Liu 等,2023;Zhao 和Wang,2022;Zhang 等,2022b;Li 等,2023),这些方法将源域与目标域在核空间上对齐以解决域差异,但其泛化能力受域偏移复杂度的影响(Liu等,2020)。

图2 域自适应Fig.2 Domain adaptation((a)source domain;(b)target domain)

域泛化方法的训练集和测试集的设定如图3 所示,Li 等人(2021)和Zhou 等人(2023)在多个已知域进行训练,提取域不变信息向未知域进行迁移,但是性能高度依赖于训练集域数量(Choi 等,2021)。因此,面对医学图像有标注数据稀少的情况,这两种方法均不能有效缓解域偏移问题。

图3 域泛化Fig.3 Domain generalization((a)train-set;(b)test-set)

为了克服上述两种方法的缺点,Volpi 等人(2018)提出了用于分类任务的单域泛化方法,仅需对单一域进行训练然后泛化至目标域,其训练集和测试集的设定如图4所示。

图4 单域泛化Fig.4 Single-domain generalization((a)train-set;(b)test-set)

单域泛化学习范式非常适合医学图像中域未知与数据量小的特点。受此启发,本文拟将单域泛化引入到 X-ray 乳腺肿瘤检测中,以缓解乳腺肿瘤图像中的域偏移问题。本文单域泛化X-ray 乳腺肿瘤检测的设定如图5 所示,其中训练集为不包含域偏移的原始图像,测试集为引入域偏移后的图像。

图5 单域泛化X-ray乳腺肿瘤检测Fig.5 Detection of breast tumor by single-domain generalization((a)train-set;(b)test-set)

然而,研究发现将单域泛化中常用的正则化与白化方法(switchable whitening,SW)(Pan 等,2019)直接引入到目标检测模型将导致检测性能降低(Wu和Deng,2022)。本文研究发现,基于分类的单域泛化采用的整体对齐方式并不适用于目标检测任务。图6 给出了特征空间样本对齐的过程,其中红色虚线表示域决策边界,三角形与矩形表示样本数据,颜色表示目标类别。图6(a)为分类对齐范式,在分类任务中每幅图像仅包含一个实例,直接对整体进行对齐即可。图6(b)为目标检测整体对齐范式,目标检测任务由于目标的局部特性,且单一图像中包含多个目标,采用整体对齐导致了域类别的错误匹配。为此,本文拟提出目标检测实例对齐范式,如图6(c)所示,以实例为对齐单位将正则化与白化方法SW嵌入至检测头,并采用参数共享仅对分类特征图进行正则化与白化处理。这种以检测头处的单一实例为对齐单位,避免了对全局特征处理时导致的域类别错误匹配,同时有效缓解了整体对齐时的模型性能骤降问题。

图6 特征空间中样本对齐过程Fig.6 Sample alignment process in feature space((a)classification alignment paradigm;(b)global alignment paradigm for object detection;(c)instance alignment paradigm for object detection)

另外,为了降低医学图像中过度特征融合所引入的噪声,本文拟设计域特征增强模块,将其嵌入FPN(feature pyramid network)全局特征融合部位。具体来说,域特征增强模块通过可变性卷积网络(deformable convolutional network,DCN)(Dai 等,2017)增强前景目标信息,为后续实例泛化提取特征更好地抑制噪声。

综上,本文提出一种单域泛化X-ray乳腺肿瘤检测模型,通过实例泛化与特征增强来有效缓解模型在未知域上性能骤降的问题,同时以更少的数据量获得比全监督方法更优的检测性能。

1 相关工作

1.1 域自适应目标检测

域自适应方法旨在通过无标注的目标域与有标注的源域来缓解域偏移问题。当前,绝大多数域自适应方法都采取对抗训练的形式(Ganin 和Lempitsky,2015),即采取域判别器与梯度反转层提取域不变特征以消除域偏移的影响。Chen 等人(2018)首次将该方法应用于目标检测领域,在此研究基础上,针对浅层特征强对齐、高层特征强弱对齐的域自适应方法(Saito等,2019)被提出。

此外,基于图像增强的ConfMix 模型(Mattolin等,2023)被提出,该方法通过将源域多幅图像进行混合拼接以提升模型在目标域的泛化性能。

尽管上述研究取得了较好的效果,但域自适应需获取源域与目标域数据,并尽可能确保源域与目标域较小的数据分布差异以维持迁移学习的稳定性。在医学图像领域,医疗数据数量少且域偏移未知,使源域与目标域难以划分,因此,域自适应的方法并不适于医学图像领域。

1.2 单域泛化

单域泛化是指通过在无域偏移或较少域偏移的数据集上进行模型训练,然后将该模型泛化至域偏移未知的测试集。目前,单域泛化一般采用数据增强与正则化方法来解决分类任务(Qiao等,2020),此外,Fan 等人(2021)提出一种通用正则化方法提升分类任务的泛化能力。基于上述研究,Wu 和Deng(2022)首次提出基于单域泛化的目标检测模型Single-DGOD,但该研究发现不同的正则化与白化方法降低了目标检测性能。因此,本文在医学数据场景下探索性能骤降的原因并解决正则化与白化方法对单域泛化目标检测的负面影响。

1.3 正则化与白化

域偏移现象本质为数据分布上的偏移,因此通过对数据分布的调整可以有效缓解域偏移问题。提升泛化性能可以采用正则化方法与白化方法。常用的正则化方法有BN(batch normalization)(Ioffe 和Szegedy,2015)和IN(instance normalization)(Ulyanov等,2017)。BN 通过对每一批次的期望与方差进行统计以调整数据分布,IN 利用通道上的信息对数据分布进行调整。常用的白化方法主要有natural neural network(Desjardins 等,2015)和decorrelated batch normalization(Huang 等,2018)等。白化操作根据协方差矩阵的过滤掉图像风格信息从而广泛应用于风格迁移等领域(Li等,2017)。

2 单域泛化X-ray乳腺肿瘤检测模型

针对单域泛化场景下目标检测性能有限的问题。本文提出了一种单域泛化模型(single-domain generalization model,SDGM)进行X-ray 乳腺肿瘤检测,其中着重设计了实例泛化模块(instance generalization module,IGM)和域特征增强模块(domain feature enhancement module,DFEM)来提升模型对于未知域偏移上的泛化能力。SDGM结构如图7所示,采用ResNet-50(residual network-50)作为主干特征提取网络,然后通过域特征增强模块融合上采样与下采样中的全局信息以抑制噪声,并在检测头处加入实例泛化模块对每个实例的类别语义信息进行正则化与白化处理。下面对所提单域泛化模型SDGM 进行理论分析,并对实例泛化模块和域特征增强模块进行详细介绍。

图7 SDGM结构图Fig.7 Structure diagram of SDGM

2.1 模型理论分析

定义x为输入图像,y为图像标签。a,b,c,d代表未知域图像。xJoint、yJoint表示未知图像及其对应的标签。首先在输入图像与未知域图像在数据分布上满足P(x)≠{P(xa),P(xb),P(xc),P(xd) }的设定。考虑到域泛化优化的目标是获取域不变特征,这里将采取联合分布代替上述等式,即P(x)≠{P(xa),P(xb),P(xc),P(xd)}表示为P(x) ≠P(xJoint)。因此,单域泛化的目标是使P(x,y)=P(xJoint,yJoint) 成 立,即单域 泛化下 的特征提取器所提取的域不变特征的数据分布与未知域的联合数据分布相等。根据贝叶斯公式,有

为了使P(x,y)=P(xJoint,yJoint) 成 立,需保证P(x|y)P(y) 或P(y|x)P(x)与未知域上的保持相等。假设未知域与当前域目标都为肿瘤,肿瘤标签样本服从独立同分布,因此标签框概率P(y) 分布相等。则可以得到条件:P(y) ≈P(yJoint)。

因此,只需保证P(x|y) ≈P(xJoint|yJoint)即可以保证整体分布近似相等。由于P(x) ≠P(xa,xb,xc,xd),该式为不同域风格变化所导致。然而,不同域中实例特征相对保持不变,即获取域不变实例特征后P(x) ≈P(xJoint),进而保证整体在多个域下的泛化性能。本文所设计的实例泛化模块与域特征增强模块着重提取其域不变特征来保证P(x) ≈P(xJoint)成立。

2.2 实例泛化模块IGM

目标检测任务由分类与回归两项子任务构成,Song等人(2020)首次针对分类与回归中特征图的差异性进行研究,并证明分类子任务与回归子任务间存在差异性,其影响目标检测性能。受该研究的启发,本文探究了分类与回归之间的差异性对实例泛化是否也存在影响。

回归子任务主要是预测目标的具体位置,而在肿瘤检测中,不同域偏移下的回归偏移数据分布相对离散,无明确域类别决策边界,若针对其回归子任务进行正则化与白化处理将会引入更多的噪声;分类子任务主要是判别不同子目标的类别,在分类分支中,样本的数据分布存在清晰的类别与域决策边界,以此进行实例级别的细粒度泛化对齐将能够有效提升肿瘤检测性能。

上述分析表明,域泛化中分类子任务与回归子任务间存在耦合性,因此,本文仅在分类子任务中采用正则化与白化方法SW(Pan 等,2019)。另外,Volpi 等人(2018)指出在分类子任务中正则化与白化方法通常需对特征图进行多次处理,因此本文采取共享参数的形式对特征图进行N次正则化与白化处理来设计实例泛化模块IGM。

实例泛化模块IGM 的具体结构如图8 所示,该模块由一组3 × 3的卷积及正则化与白化方法SW 构成,共计N组。N为超参数,表示实例泛化处理的次数。

图8 实例泛化模块IGMFig.8 Instance generalization module

在基于深度学习的卷积神经网络(convolutional neural network,CNN)的模型中,图像数据维度一般为(B,C,H,W)4 个维度,其中,B表示bath size,即批次数量,C表示通道数,H(high)和W(width)分别表示高和宽。假定从数据集中随机抽取样本Xn∈R,n∈{1,2,3,⋅⋅⋅,N},N为数据集中的样本数量。SW 化处理计算需要计算均值与协方差统计量。方差矩阵计算中,wk与为可学习参数,E={bw,iw,bn,in,ln}表示计算方式的集合。具体计算为

式中,covk表示协方差矩阵。SW 方法正是利用上述操作统一正则化与白化,将原有的2个步骤归为1个步骤,极大提高了计算效率。对于医学图像,较少的操作将极大保护原始信息,能够在缓解域偏移的同时保留纹理细节以保证召回率。虽然实例泛化模块对每一个目标进行泛化性增强,但是对比常规目标检测图像,医学图像中残留有更多无关病理信息,这些细节信息无可避免地会对模型产生干扰。为此下一节将详细介绍缓解全局噪声的域特征增强模块。

2.3 域特征增强模块DFEM

为了降低乳腺肿瘤的漏检率,本文设计了域特征增强模块DFEM,通过关注肿瘤目标的语义信息来增强模型的泛化能力,不同于实例泛化模块直接提升模型的迁移性与泛化性。传统3 × 3 卷积的采样方式为矩形规则采样,如图9(a)所示,当采样目标为遮挡目标或密集目标时,传统卷积将引入大量无关噪声。为此,Dai 等人(2017)提出可变性卷积(DCN),该卷积能够改变采样轨迹,可以对目标可能出现的位置进行有效采样,如图9(b)所示。然而,面对结构更为复杂的目标时,DCN 效果仍不理想。针对此问题,基于DCN 构建的尺度感知、空间感知和任务感知的多级感知策略的dynamic head(Dai等,2021)被提出。但是dynamic head 的多级感知注意力方法太冗余,引入了大量噪声。

图9 卷积与可变性卷积Fig.9 Convolution and deformable convolutional network((a)traditional 3 × 3 convolution;(b)DCN)

在医学乳腺肿瘤图像中,全局性信息可能包含不同的尺度目标与类别信息,由于结构信息的不对称性,多尺度信息融合将会引入大量的噪声,导致尺度感知存在耦合性。相反,空间感知只对单个实例进行处理,避免了对整体采样引入噪声。因此,本文在dynamic head 基础上设计了一种仅具有空间感知的域特征增强模块(DFEM),以减小特征空间上的离群点,DFEM具体结构如图10所示。

图10 域特征增强模块DFEMFig.10 Domain feature enhancement module

由图10 可知,域特征增强模块DFEM 对比dynamic head 结构主要有两部分不同:1)在不同尺度特征上,本文所提出的特征融合模块没有通过SE(squeeze-and-excitation)注意力融合不同层间的特征。这是由于dynamic head 常用于常规场景下的目标检测。常规场景下一幅图像中存在多个不同尺度的目标,而医学图像中的肿瘤病灶尺度较为单一。因此,减少医学图像中不同尺度层级间的融合可以有效减少噪声。2)在每一层中的特征增强模块中,所提方法先利用DCN 进行细粒度特征采样,再通过SE 注意力模块抑制噪声。由于肿瘤一般存在隐蔽性,直接采用通道注意力将引入背景纹理信息。因此,先采用DCN 可变性卷积进行针对性采样来缓解该问题。在后续实验部分,本文所提方法SDGM 也与dynamic head(Dai 等,2021)进行了比较,性能提升4.7%,表明本文设计的域特征增强模块DFEM 更适合医学乳腺肿瘤检测。

3 实 验

3.1 数据集

为了验证所提方法SDGM 的单域泛化性能,将其在域内泛化场景与域间泛化场景下分别进行实验。其中,域内泛化场景由多个域噪声的INbreast(Moreira 等,2012)数据集组成,域间泛化场景由CBIS-DDSM(curated breast imaging subset of DDSM)(Lee等,2017)数据集组成。

1)INbreast 是一个公开医学图像数据集,包含115 个病例的X-ray 图像,且具有像素级别的语义分割标签与目标检测标签。本文对INbreast 数据集引入多个域偏移,如图11所示。

图11 域偏移图像Fig.11 Domain shift images

为了验证所提模型的域内泛化能力,本文采用两种不同构造方式获得具有不同数据分布的数据集,即全监督数据集和单域泛化数据集。全监督训练集通过图像增强与数据增强构造获得,单域泛化数据集中的训练集不进行图像增强,仅进行数据增强,而测试集仅进行图像增强。

INbreast 在全监督场景下设定的训练集与测试集的图像如图12 所示。训练集数据通过随机裁剪、平移、旋转、镜像等一系列数据增强方法将其扩充为5 148 幅图像;测试集为177 幅图像。全监督数据集将用于评估单域泛化场景下模型的上限性能。

图12 INbreast全监督数据集划分Fig.12 INbreast fully supervised dataset splitting((a)train-set;(b)test-set)

INbreast 全监督场景下的图像数据概率分布如图13第1行所示(绿色线表示训练集,红色线为测试集),训练集与测试集的数据分布几乎一致,符合全监督的隐式假设。INbreast 单域泛化场景下的图像数据概率分布如图13 第2 行所示,数据分布发生偏移,属于本文所要解决的域偏移问题。

图13 数据集在RGB 3个通道上的概率分布Fig.13 Probability distribution of the dataset on the RGB channels

单域泛化设定如下:INbreast训练集仅包含唯一的域,不进行图像增强,测试集包含多个域,具体设定如图5 所示。训练集为728 幅通过随机裁剪、平移、旋转和镜像等一系列数据增强方法的X-ray 图像;测试集为177 幅引入域偏移的图像。INbreast 单域泛化数据集用于评估模型在域内偏移场景下的泛化能力。

2)CBIS-DDSM 是乳 腺X-ray 图 像数 据集,由2 620个医学胶片样本组成。本文首先过滤掉CBISDDSM 数据集中的噪声标签与对应图像,将剩余的1 206 幅图像作为训练集。CBIS-DDSM 的训练集和INbreast测试集用于评估域间泛化能力。

3.2 实验细节及评估方式

实验采取PyTorch 深度学习框架,在Nvidia GTX 3080TI 上进行实验。优化器选取SGD(stochastic gradient descent),初始学习率为1E-4。评价模型的性能指标采用mAP(mean average precision),阈值为0.5。模型同时在全监督与单域泛化数据集上进行性能评估,性能差距越小表示其泛化性能越强。实验训练超参数设定如下:backbone 采用在ImageNet进行预训练的ResNet-50权重。图像输入尺寸为 600 × 1 000 像素,Batch size 设置为2。训练总周期为12 epoch,8—11 epoch学习率衰减0.1。

为了验证所提方法SDGM 的有效性,将其与如下方法进行比较,包括one-stage 方法中的Anchorfree 方 法FCOS(fully convolutional one-stage object detection)(Tian 等,2019)和FoveaBox(Kong 等,2020);Anchor-based 方法RetinaNet(Lin 等,2017)、ATSS(Zhang 等,2020)和TOOD(task-aligned onestage object detection)(Feng 等,2021)。two-stage 方法Faster R-CNN(Ren 等,2015)和Cascade-RCNN(Cai 和Vasconcelos,2018)。同时,为了评估不同类型的注意力机制的影响,本文也比较了基于Transformer 的PVTv2(pyramid vision Transformer)(Wang等,2022)与基于CNN 的注意力方法ResNeSt(Zhang等,2022c)。

3.3 性能比较

表1 给出了INbreast 数据集域内全监督场景与单域泛化场景下的乳腺肿瘤检测性能的比较。从表1 可以观察到,引入域偏移后所有模型性能骤降,以RetinaNet 为例,相比于全监督场景,单域泛化场景中其性能骤降9%。进一步分析两场景下的性能,可得到如下结论:

表1 INbreast数据集域内泛化性能比较Table 1 Comparison of performance in the intra-domain on INbreast dataset

1)所提方法SDGM 优于现有的方法,在单域泛化场景下有着绝对优势。与TOOD 等没有使用注意力机制的方法相比,SDGM 在单域泛化场景下的域偏移性能损耗至少降低了3.6%;与采用不同注意力机制的ResNeSt 和PVT-Transformer 等方法相比,所提方法SDGM 在单域泛化场景下的域偏移性能损耗分别降低了21.1%和2.8%,表明SDGM 具有更为好的鲁棒性与泛化能力。

2)局部和全局注意力机制对单域泛化场景下模型的性能具有不同的影响。如在baseline 方法中加入具有局部注意力的主干ResNeSt 后,在单域泛化场景下性能有着更大的域偏移性能损耗,表明局部注意力造成的过拟合降低了模型性能。相反,基于全局注意力的PVTv2-Transformer 在单域泛化场景下性能显著提升,表明全局信息对泛化性能至关重要。因此本文设计了域特征增强模块,用于FPN 处来有效抑制噪声,从而获取全局信息。

3)基于CNN 的baseline 方法和所提SDGM 方法比基于Transformer的方法PVTv2具有更好的单域泛化能力。在单域泛化场景下,所提SDGM、baseline和PVTv2 的域偏移性能损耗分别为7%、9% 与9.8%。这表明Transformer 虽然具有更好的特征提取能力,但比CNN 具有更差的迁移性。另外,Transformer 需要消耗更多的显存与计算资源。因此本文所提方法SDGM具有更好的单域泛化能力。

4)在域偏移性能损耗存在性能优势的前提下,方法在全监督场景下的性能越好,其在单域泛化场景下的性能也越好。如在全监督场景下TOOD 方法比Cascade-RCNN 方法的性能提升了13.5%;在单域泛化场景下TOOD 方法比Cascade-RCNN 方法的性能提升了4.8%;本文所提SDGM 模型在单域泛化场景下的域偏移性能损耗降低了7%。当域偏移性能损耗不存在性能优势时,则方法在全监督场景下的性能越好,其在单域泛化场景下的性能则越差。如RetinaNet+ResNeSt 方法域偏移性能损耗为15.4%,尽管该方法在全监督场景下性能优于Cascade-RCNN,但其在单域泛化场景下的性能更差。

5)one-stage 方法比two-stage 方法具有更好的泛化能力。two-stage方法由于需要RPN(region proposal network)对目标进行候选,导致其在不同域上造成更大的域偏移性能损耗。相反,one-stage方法更为简洁,受域偏移影响更小,因此相对域偏移性能损耗更低。

此外,表2 展示域间泛化性能的结果,即训练集采取CBIS-DDSM 泛化性能比较。由表2可知,在不同数据集之间,所提方法SDGM 比RetinaNet 方法性能提升了5.8%,表明了所提方法SDGM 在域间也具有很好的泛化性与鲁棒性。

表2 CBIS-DDSM域间泛化性能比较Table 2 Comparison of performance in the inter-domain on CBIS-DDSM

表3 给出了在INbreast 数据集上当前SOTA(state of the art)全监督X-ray乳腺肿瘤检测方法的性能比较。由于训练集与测试集划分不同,以及数据预处理方法存在差异,导致不同的benchmark 性能不同。可以看出,所提方法SDGM 比现有方法有着显著的性能优势。

表3 全监督场景下X-ray乳腺肿瘤检测性能Table 3 Breast tumor detection performance in X-ray images in supervised scenarios

综上,所提方法SDGM 能够有效缓解域偏移带来的性能损失,在单域内泛化场景下达到SOTA,在使用更少数据的情况下SDGM 优于baseline 全监督方法,在域间泛化场景也具有很好的普适性。对比当前全监督场景下的方法,所提方法也具有显著的性能优势。SDGM 能够取得优异性能主要归因于本文所设计的实例泛化模块IGM 和域特征增强模块DFEM。

3.4 消融实验

3.4.1 模块消融实验

本节通过消融实验验证实例泛化模块与域特征增强模块的泛化能力,实验结果见表4。

表4 消融实验Table 4 Ablation experiments

从表4 可知,实例泛化模块与域特征增强模块分别从特征角度与正则化白化角度提升了模型SDGM 的泛化性。在INbreast 数据集的单域泛化场景下,单独使用域特征增强模块,模型性能比baseline 方法提升了6.4%;单独使用实例泛化模块,模型性能比baseline 方法提升了7.7%;同时采用二者的SDGM,性能比baseline 方法提升了9.7%。该结果充分说明了本文设计的域特征增强模块和实例泛化模块能够有效提升单域泛化能力,避免了相同处理方法产生的过拟合问题或干扰问题。

3.4.2 实例泛化模块分析

Wu 和Deng(2022)首次将单域泛化任务从分类任务引入目标检测领域,但该研究并未采取单域泛化分类任务中常用的正则化与白化方法SW,并通过实验验证了SW 有损于目标检测性能。该文并没有给出合理的分析和解释。本文分析认为这是由于目标检测任务的耦合性,即将分类与回归任务耦合至一体所致。因此,本节采取不同的组合形式进行实验来进一步验证本文上述观点。

另外,实验对参数共享和参数独立也进行了对比。实验中超参数N设置为4,结果见表5,其中第1行是baseline 方法的性能。从表5 可以看出:1)仅在分类任务中引入实例泛化模块IGM,特别是在参数共享情况下,目标检测性能比baseline 方法提升了5%;而仅在回归任务中引入实例泛化模块IGM,目标检测性能迅速降低;在回归和分类任务中同时引入实例泛化模块IGM,目标检测性能也迅速降低。因此,只要是在回归任务中引入实例泛化模块IGM,目标检测性能都会受到很大影响,即正则化白化SW对回归任务有负面影响。2)仅在分类分支中采用实例泛化模块IGM 时,参数共享时的目标检测性能比参数独立时的性能提升了5.2%。由此可知,参数共享比参数独立具有更好的泛化性能。

表5 实例泛化模块性能分析(N =4)Table 5 Performance analysis of instance generalization module(N =4) /%

因此,本实验为Wu 和Deng(2022)的研究中目标检测性能骤降找出了可能存在的原因:1)没有对分类与回归进行解耦合;2)参数没有共享;3)正则化白化SW嵌入的部位不正确等。

3.4.3 超参数N分析

对实例泛化模块重复次数,即超参数N进行实验分析,验证了其在乳腺肿瘤场景下对泛化性能的影响,实验结果见图14。由于医学图像存在较多的背景噪声,不同N对性能影响很大。当N为6 时实例泛化模块能达到较好的性能。对比默认超参数N=4,N增大可以更好地提升性能。

图14 超参数N对泛化能力的影响Fig.14 Effection of hyperparameter N on generalization ability

3.4.4 域特征增强模块分析

对域特征增强模块进行实验分析,并与采取相同思想的文献(Dai 等,2021)进行了对比,实验结果见图15,图中,B表示baseline方法RetinaNet。

图15 域特征增强模块分析Fig.15 Domain feature enhancement module analysis

由图15 可知,本文所设计的域特征增强模块能够有效提取域不变特征,并抑制噪声。与Dai 等人(2021)所提方法相比,mAP0.5 和泛化能力均提升了4.7%。域特征增强模块使得模型取得良好的目标检测性能,主要是因为其能够有效克服dynamichead(Dai等,2021)中采用的冗余的注意力机制和卷积操作。

3.5 实例泛化对性能的影响

为了进一步验证实例泛化范式对单域泛化的性能影响,本节对原图与不同细粒度增强图像的性能进行了比较,视觉比较结果见图16,性能比较结果见图17,图中不同的sample 代表不同程度的细粒度增强图像。数据集为CBIS-DDSM,其中训练集与测试集的比例为8∶2。细粒度图像增强同时作用于训练集与测试集。

图16 不同细粒度增强图像的视觉对比Fig.16 Visual comparison of different fine-grained enhanced images

图17 不同细粒度增强图像的性能比较Fig.17 Performance comparison of different fine-grained enhanced images

从图16 和图17 可以看出:1)原图(raw)与sample 1 进行比较,图16 中红色框中的特征更为显著,同时图17中对应的检测性能也更高。2)图16中sample 2 红框中的特征比sample 1 红框中的特征更为明显,但是图17 中对应的性能却下降了,这是由于背景中的无关特征也增强了。3)图16中sample 3中目标周围的腺体组织相对增强,使得网络更易于区分前景与背景,因此图17 中sample 3 相对于sample 2 性能有所上升。综上,由于本文所提实例泛化的增强范式能够同时考虑目标特征与背景特征的差异关系,从而实现对目标实例处的噪声的有效抑制,提升X-ray乳腺肿瘤的检测性能。

3.6 视觉比较

在单域泛化场景下将所提方法SDGM 与baseline方法进行视觉比较,结果如图18所示。图18(a)表示所提方法SDGM 的检测结果;图18(b)表示baseline 方法RetinaNet 检测结果;图18(c)表示标签框(真值框)。由图18 知,第1 行图像中本文所提方法SDGM 检测准确,而baseline 方法产生了误检,主要是因为所提SDGM 得益于所设计的域特征增强模块的细粒度特征抽取;第2 行图像中由于域偏移的影响,baseline 方法回归预测框不准确,而本文所提方法SDGM 能够获得更为准确的预测框;第3 行图像中,相比于baseline 方法,所提方法SDGM 能够有效检测出隐蔽病灶。以上结果再次表明,本文通过设计的实例泛化模块与特征增强模块能够有效提升模型SDGM的目标检测性能。

图18 单域泛化检测结果视觉比较Fig.18 Vision comparison of single-domain generalization detection results((a)SDGM;(b)RetinaNet;(c)ground truth)

4 结论

为了缓解乳腺肿瘤图像标注匮乏问题,提升乳腺肿瘤检测精度,本文提出了一种针对X-ray乳腺肿瘤检测的单域泛化目标检测模型SDGM,其中着重设计了实例泛化模块和域特征增强模块。实例泛化模块有效解决了单域泛化目标检测方法在正则化与白化SW 中性能骤降的问题,域特征增强模块则有效缓解了多尺度特征融合在肿瘤检测中所引发的噪声问题。

所提SDGM 模型与one-stage 和two-stage 方法以及两类注意力机制进行了性能比较。在引入域偏移的INbreast 数据集的benchmark 中,SDGM 比baseline方法的检测性能提升了9.7%,甚至优于全监督下的检测方法;SDGM 在CBIS-DDSM 数据集的域间泛化场景也具有很好的泛化能力。另外,所提SDGM 在结构与效率上优于现有的two-stage 肿瘤检测方法,对数据的依赖程度优于基于K-means 聚类范式的one-stage 肿瘤检测方法。上述结果表明,所提SDGM 方法在X-ray 医学图像肿瘤检测中具有重要的应用价值和广泛的应用前景。

虽然本文所提SDGM 很好地提升了X-ray 图像下的单域泛化肿瘤检测性能,但是其在临床实践中仍然存在较大的局限性,不能满足MRI(magnetic resonance imaging)、CT(computed tomography)、PET(positron emission tomography)、SPECT(single-photon emission computed tomography)等多模态或跨模态的肿瘤检测需求。因此,未来的一个研究方向是充分利用互补且异构的多模态乳腺肿瘤图像数据,设计多模态或跨模态检测模型,在保障多模态图像间的鲁棒性的同时提升检测精度。

猜你喜欢
实例特征性能
如何表达“特征”
提供将近80 Gbps的带宽性能 DisplayPort 2.0正式发布
不忠诚的四个特征
抓住特征巧观察
Al-Se双元置换的基于LGPS的thio-LISICON的制备与性能表征
强韧化PBT/PC共混物的制备与性能
完形填空Ⅱ
完形填空Ⅰ
RDX/POLY(BAMO-AMMO)基发射药的热分解与燃烧性能
线性代数的应用特征