人工智能应用于基层医院糖尿病视网膜病变大规模筛查的临床价值研究

2024-04-25 06:27高荔姗朱萍
浙江医学 2024年7期
关键词:阅片眼科灵敏度

高荔姗 朱萍

糖尿病是全球重大的健康卫生问题,2015 年,全世界约4.15 亿人被诊断患有糖尿病,预计2040 年将增加至6.42 亿[1],势必造成沉重的社会医疗经济负担。糖尿病性视网膜病变(diabetic retinopathy,DR)是糖尿病患者最常出现的致盲性微血管并发症之一,超过80%的1 型糖尿病患者和70%的2 型糖尿病患者会在10~15 年病程中患上不同程度的DR[2]。研究显示,中国糖尿病人群中DR 患病率高达23%,其中非增殖型DR 为19.1%,增殖型DR 为2.8%[3]。由于DR 患者在早期通常无明显症状,因此有必要进行筛查,并通过早期干预来避免视力受损[4]。然而,由于糖尿病患者数量庞大、眼科医师相对缺乏等因素的影响,筛查需求尚未得到满足[5-6]。人工智能(artificial intelligence,AI)是将算法运用于大量数据,使计算机系统具备一定的认知能力,是目前计算机学科的一个重要前沿方向[7-8]。近年来,基于图像的AI技术逐渐应用于医学领域,特别是眼科领域[9]。本研究通过比较AI 系统与眼科医师对糖尿病患者DR 的诊断效能及其一致性,探讨AI 软件的应用价值,以期为基层医院糖尿病患者DR 筛查提供新的方法与平台。

1 对象和方法

1.1 对象 依托2020 年海宁市民生实事项目“糖尿病眼底智能筛查”,选取2020 年7 月至2021 年12 月在本院行DR 筛查的28 300 例(56 600 眼)糖尿病患者为研究对象。采用分层随机取样法抽取3 512 例(7 024 眼)糖尿病患者进行研究,其中男1 964 例,女1 548 例;年龄22~80(58.48±21.31)岁;糖尿病病程1~22 年,中位病程为11(6,17)年。纳入标准:(1)符合中华医学会糖尿病学分会制定的《中国2 型糖尿病防治指南(2017 年版)》[10]中2 型糖尿病诊断标准;(2)无恶性肿瘤、血液系统、免疫系统等严重全身疾病;(3)精神状态及沟通能力良好。排除标准:(1)玻璃体、晶状体、角膜等屈光介质浑浊,不能获得良好质量图像;(2)合并其他眼底病变,如视网膜静脉阻塞、中心性浆液性脉络膜视网膜病变、老年性黄斑变性、葡萄膜炎、息肉样脉络膜血管病变等眼部血管疾病。本研究经本院医学伦理委员会审查通过(批准文号:2022 伦审5 号)。

1.2 方法 AI 系统和眼科医师分别针对3 512 例(7 024 眼)的眼底照片进行阅片。

1.2.1 AI 系统阅片 AI 系统利用自动免散瞳眼底照相机(型号:AFC-330,日本尼德克)进行眼底照相,以黄斑为中心对患者拍摄1 张45°彩色眼底相片。将拍摄的照片上传到AI 系统(浙大睿医AI 系统视网膜阅片系统),由AI 系统进行阅片,并结合DR 国际分期诊断标准,对眼底影像自动给出判读结果。典型DR 患者眼底彩色相片见图1(插页)。

图1 DR 患者眼底彩色相片(A:DR 患者右眼彩色眼底相片,根据DR 国际分期诊断标准,其分期为DR 轻度非增殖期;B:糖尿病患者右眼彩色眼底相片,根据DR 国际分期诊断标准,其分期为DR 中度非增殖期)

1.2.2 眼科医师阅片 眼科医师利用超广角眼底照相机(型号:CLARUS 500,德国蔡司)拍摄后极部(黄斑为中心)眼底彩照,在所有拍摄的眼底彩照上识别DR 早期治疗研究(early treatment diabetic retinopathy study,ETDRS)标准7 视野进行视网膜图像分析,象限的范围遵循ETDRS 的规定:横轴为通过视盘上下缘的双横线,纵轴为通过视盘中心垂直线。两条轴线相互垂直所形成的4~7 的圆形区,即为颞上、颞下、鼻上、鼻下4个象限,所有圆的半径为视盘中心至黄斑中心的连线长度。由3 位经验丰富的眼科医师根据眼底彩照进行阅片,3 位医师彼此间为双盲诊断判定有无DR,诊断为DR 的患者均行光学相干断层扫描成像(optical coherence tomography,OCT),初诊为中度非增殖性DR(non-proliferative diabetic retinopathy,NPDR)、重度NPDR以及增殖性DR(proliferative diabetic retinopathy,PDR)患者均行荧光素眼底血管造影(fluorescein fundus angiography,FFA),辅助分期诊断。以3 位医师相同诊断结果为最终诊断结果,若3 位医师诊断存在争议,由本院另一位眼底病专家进行评定并给出最终结果。

1.2.3 诊断标准 AI 系统和眼科医师均根据2003 年国际DR 分期标准将DR 分为无DR、轻度NPDR、中度NPDR、重度NPDR 和PDR。考虑到AI 系统进行大基数DR 初筛后需进一步给予转诊治疗的临床需要,因此本研究统计了需要眼科专业医师干预的有转诊意义的DR(referable diabetic retinopathy,RDR),即中度以上NPDR、PDR 或黄斑水肿[11]。

1.2.4 OCT 检查 使用光学相干断层扫描仪(型号:VG100D,中国视微),按操作标准对前额及下颌位置进行固定,确保相干光线无法垂直进入眼内;应用内注视的方式,以黄斑中心凹为中心分别行水平、垂直角度的线形扫描。阳性表现为视网膜黄斑中心凹厚度>250 μm。

1.2.5 FFA 检查 使用FFA 仪(型号:Meditec AG,德国蔡司),造影前对患者进行荧光素钠注射液皮试;对皮试阴性患者经肘静脉推注200 g/L 荧光素钠3 mL,推注完毕后即刻开始计时,对患者进行相应显影分期的拍照。阳性表现为静脉早期视网膜瘤样强荧光点,毛细血管闭塞、扩张,动静脉早期新生血管荧光形态可见、无灌注区弱荧光、出血遮蔽荧光,动静脉晚期新生血管渗漏融合、动静脉异常血管网,晚期荧光渗漏持续不退、边界模糊。

1.3 统计学处理 采用SPSS 26.0 统计软件。符合正态分布的计量资料以表示,当方差不齐时,组间比较采用不假定方差相等的t检验;不符合正态分布的计量资料以M(P25,P75)表示。计数资料组间比较采用χ2检验。以眼科医师诊断为金标准,计算AI 系统诊断DR、DR 分级和RDR 的灵敏度[灵敏度=真阳性人数/(真阳性人数+假阴性人数)×100%]、特异度[特异度=真阴性人数/(真阴性人数+假阳性人数)×100%]、漏诊率[漏诊率=(漏诊DR 人数/总人数)×100%]和误诊率[误诊率=(误诊DR 人数/总人数)×100%]。采用Kappa 检验评估AI 系统与眼科医师诊断DR、DR 分级及RDR 的一致性,Kappa 值0.61~0.80 为显著一致性,Kappa 值>0.80 为高度一致性。P<0.05 为差异有统计学意义。

2 结果

2.1 AI 系统与眼科医师DR 诊断的一致性比较 7 024眼中,AI 系统诊断显示DR 825 眼,无DR 6 199 眼;眼科医师诊断显示DR 807 眼,无DR 6 217 眼。以眼科医师诊断为金标准,AI 系统诊断DR 的灵敏度为91.69%,特异度为98.63%,漏诊率为8.30%,误诊率为1.36%。AI 系统与眼科医师DR 诊断的一致性比较差异有统计学意义(Kappa=0.831,P<0.001),见表1。

表1 AI系统与眼科医师DR诊断的一致性比较(眼)

2.2 AI 系统与眼科医师DR 分级诊断的一致性比较7 024 眼均纳入DR 分级诊断检测。以眼科医师诊断为金标准,AI 系统诊断轻度NPDR 的灵敏度为82.72%,特异度为98.93%,漏诊率为17.27%,误诊率为1.07%;AI 系统诊断中度NPDR 的灵敏度为84.36%,特异度为99.27%,漏诊率为15.63%,误诊率为0.72%;AI 系统诊断重度NPDR 的灵敏度为86.11%,特异度为99.92%,漏诊率为13.88%,误诊率为0.07%;AI 系统诊断PDR的灵敏度为86.95%,特异度为99.97%,漏诊率为13.04%,误诊率为0.03%。AI 系统与眼科医师DR 分级诊断的一致性比较差异有统计学意义(Kappa=0.847,P<0.001),见表2。

表2 AI系统与眼科医师DR分级诊断的一致性比较(眼)

2.3 AI 系统与眼科医师RDR 诊断的一致性比较7 024 眼均纳入RDR 诊断检测。以眼科医师诊断为金标准,AI 系统诊断RDR 的灵敏度为88.16%,特异度为99.32%,漏诊率为11.83%,误诊率为0.67%。AI 系统与眼科医师RDR 诊断的一致性比较差异有统计学意义(Kappa=0.828,P<0.001),见表3。

表3 AI系统与眼科医师RDR诊断的一致性比较(眼)

2.4 AI 系统与眼科医师单张阅片平均耗时比较 AI系统单张阅片平均耗时为(1.58±0.22)s,短于眼科医师的(5.83±2.11)s,差异有统计学意义(t=-118.723,P<0.001)。

3 讨论

近年来,在眼科领域,尤其在眼底疾病方向,基于AI 的计算机辅助和自动视网膜图像评估工具的诊断性能和技术已经取得了迅速的发展,主要应用于DR、青光眼、年龄相关性黄斑变性、早产儿视网膜病变等疾病[12-13]。AI 系统能够识别出血、渗出、棉絮斑和视网膜微血管循环异常等DR 病变,对视网膜图像进行血管分割、视盘定位、动静脉分类和病变检测,通过特征检测网络模块、分类网络模块、注意力机制和特征融合3 个相互关联的DR 分级模块处理,对患者进行诊断并协助临床分级诊疗。

本研究中眼科医师基于ETDRS 模式的眼底彩照、OCT、FFA 等多种影像结果参考下辅助诊断,这对眼科医师诊断的精确性有了极大保证,相比之下,AI 系统仅根据眼底彩照阅片就能进行DR、DR 分级和RDR 诊断,并基于RDR 分级转诊,后者更能充分发挥基层医院和二级及以上医院共同组成的医疗团队服务作用,达到降低DR 致盲率的防控目标,符合目前我国大部分地区,尤其是基层医院在医疗资源方面相对不足的现状。

本研究7 024 眼中,眼科医师诊断DR 807 眼,发病率为11.48%,提示平均每11 例糖尿病患者中就有1~2例发生DR,发病率较高,因此对糖尿病患者进行定期DR 筛查具有极大的必要性[14]。以眼科医师诊断为金标准,AI 系统诊断DR 的灵敏度为91.69%,特异度为98.63%,Kappa 值为0.831。其中,诊断轻度NPDR 的灵敏度为82.72%,特异度为98.93%;诊断中度NPDR 的灵敏度为84.36%,特异度为99.27%;诊断重度NPDR的灵敏度为86.11%,特异度为99.92%;诊断PDR 灵敏度和特异度最高,分别为86.95%、99.97%;两组DR 分级诊断结果一致性分析的Kappa 值为0.847。在判断RDR 中,AI 诊断灵敏度达到88.16%,特异度为99.32%,Kappa 值为0.828。以上结果提示,在DR 诊断和分级诊疗中,AI 系统诊断与眼科医师诊断具有高度一致性,且该数据与相关研究结果大致相同[14-17],可满足基层医院AI 大规模DR 初筛的需要,对“基层首诊、分级医疗、上下联动”DR 分级转诊医疗模式的推进有重大意义。

虽然AI 系统与眼科医师的诊断有高度一致性,但是仍有部分诊断不一致的案例,分析两者结果存在差异的原因可能有:(1)AI 仅以黄斑区为中心的45°彩色眼底相片结果为参考,眼科医师则在ETDRS 7 个象限眼底彩照、OCT、FFA 等多种影像结果参考下辅助诊断;(2)部分患者屈光间质混浊,眼底图像质量不高;(3)机器长期使用后出现镜头变脏或反光等因素影响阅片;(4)AI 系统在深度学习法中使用的眼底彩照与本研究中使用的眼底彩照来源于不同的眼底照相机,成像质量存在差异。因此,保障图像质量是AI 系统筛查DR 的关键[18]。此外,本研究中不足之处在于,所采用的浙大睿医AI 系统视网膜阅片系统所识别的照片均为AFC-330 自动免散瞳眼底照相机拍摄,并未考虑该系统对其他型号眼底照相机的兼容性。

在阅片时间方面,本研究中AI 系统单张阅片平均耗时较眼科医师明显缩短。李萌等[19]指出,与医师组相比,AI 系统对1 000 张确诊的彩色眼底照片的单张阅片时间总耗时均明显缩短,与本文研究结果一致。说明相对于人工阅片,AI 系统更加适用于区域集中阅片、大规模筛查等高工作强度的工作;此外,人工阅片耗时可能受到专业程度、熟练程度、身体状况、注意力等因素的影响,但AI 系统则避免了上述因素。然而值得指出的是,AI 系统阅片速度可能受到系统本身运行速度、计算机配置、算法复杂程度等因素的影响。

综上所述,AI 系统用于糖尿病患者DR 诊断的阅片时间较眼科医师短,且诊断DR 和RDR 的灵敏度、特异度与眼科医师具有高度一致性。AI 系统的应用可大幅度提升眼科医师的接诊数量,缓解基层医院专科医师工作压力及医疗资源紧张情况,且其具有不受疲劳影响和自始自终以细节为导向的优势,值得推广应用,以期为广大糖尿病患者带来极大的福音。

猜你喜欢
阅片眼科灵敏度
高、低年资住培医生应用人工智能检出脑转移瘤的价值
《住院医师规范化培训教学阅片指南(2022年版)》解读
眼科诊所、眼科门诊、视光中心的区别
第二十二届亚非眼科大会(AACO 2022)
第二十二届亚非眼科大会(AACO 2022)
ORH方法在评价肋骨骨折多阅片者诊断试验中的应用*
导磁环对LVDT线性度和灵敏度的影响
地下水非稳定流的灵敏度分析
SP-1000i全自动推片染色仪及CellaVision DM96自动阅片仪在形态学检验人员镜下比对中的应用
穿甲爆破弹引信对薄弱目标的灵敏度分析