运用3种统计学方法构建的顽固性产后尿潴留的风险预测模型的分析比较*

2022-10-21 04:28邓连方黄秋杰
广西医科大学学报 2022年9期
关键词:顽固性线图决策树

邓连方,梁 洁,卢 丹,黄秋杰,何 水

(钦州市第一人民医院产科,钦州 535000)

阴道分娩产后尿潴留(PUR)是产科常见并发症,发生率为1.5%~47%[1],部分产妇会因症状渐性加重而发展为顽固性PUR,威胁产妇生命健康。早期识别和准确预测产妇产后PUR 风险对临床采取针对性预防措施具有重要的意义。然而,目前临床多采用Logistic 回归模型分析发生PUR 的影响因素[2],其虽有训练速度快、简单易懂等特点,但无法直接呈现各因素对结果变量的重要程度。列线图是整合多个相关因素预测某事件发生概率的模型图,具有直观、可视化特点,在医学领域常用于疾病影响因素的风险预测;数据挖掘技术是一种较为新兴的统计学方式,如决策树、随机森林等均被证明可用于预测疾病发生[3-4]。目前这3种预测模型在顽固性PUR 的应用报道较少,且缺乏关于这3 种统计学方法预测顽固性PUR 的分析研究。本研究旨在对比列线图、决策树及随机森林模型对顽固性PUR的预测效能。

1 对象与方法

1.1 研究对象 回顾性分析2020 年1 月至2021 年12月在钦州市第一人民医院经阴道分娩的380例产妇的临床资料。纳入标准:(1)初产妇、足月、单胎;(2)头位妊娠,经阴道自然分娩;(3)产后6~8 h 内出现尿潴留,产后2 d 后有尿但无法自行排出。排除标准:(1)产前合并泌尿系统感染疾病者;(2)产前合并妊娠期高血压、糖尿病、甲亢者;(3)其它原因引发尿潴留(如产妇膀胱肿物、受外伤等)者;(4)严重精神系统疾病者;(5)合并严重肝、肾功能异常者。

PUR判断标准[5]:阴道分娩后6 h内无法自行排尿,或在自行排尿后经超声测定膀胱内残余尿量>150 mL;顽固性PUR 是产后2 d 有尿但不能自行排出,需借助其他手段进行排尿。根据产后有无顽固性PUR分为顽固性PUR组和对照组。

1.2 资料收集 收集产妇的临床资料,包括年龄、孕周、分娩前体质量、妊娠糖尿病、妊娠高血压、总产程时间、第一产程时间、第二产程时间、人工破膜、分娩镇痛时间、产钳助产、会阴侧切伴裂伤及巨大儿(新生儿出生1 h内体重超过4 kg)等[6]。

1.3 数据预处理 列线图和决策树按照机器学习设置,将产妇按7:3的比例分为训练集(266例)和测试集(114例);随机森林按照随机样本的分割节点,按照机器学习设置,将患者分为训练集为2/3(254例)与测试集为1/3(126例)。

1.4 列线图模型 在训练集数据上,采用R Studio软件中的lrm函数建立初始Logistic回归模型,基于已识别的相关因素,将显著性P<0.05 的变量构建列线图模型。

1.5 决策树模型 本研究使用R 语言中的rpart 函数构建决策树模型,“因变量”为发生顽固性PUR,“自变量”为具统计学意义的特征变量,指定最小代价复杂度剪枝中的复杂度参数CP 设置为0.012 5,并运算生成决策树分析模型。

1.6 随机森林模型 在Rstudio 软件中,采用randomforest 程序包对随机森林分类识别并构建模型。randomforest 函数在进行模型构建过程中主要包含2个模型参数,分别是ntree和mtry。ntree参数设置为500,即随机森林中默认存在500 颗树,mtry默认设置为在每次拆分时随机抽样候选的变量数。根据上述参数,构建随机森林初始模型。

1.7 统计学方法 采用SPSS 23.0统计软件分析数据,计量资料以均数±标准差()表示,两组间比较采用t检验;计数资料以百分率(%)表示,率的比较采用χ2检验。将单因素分析中差异具有统计学意义的变量作为输入变量,将是否发生顽固性PUR作为结局变量,在训练集中分别建立列线图、决策树模型及随机森林模型,通过计算预测模型的准确度、灵敏度、特异度、召回率、精确度及受试者工作特征(ROC)曲线下面积(AUC)评价3种统计学模型的预测效能。以P<0.05为差异有统计学意义。

2 结果

2.1 3 组临床资料比较 380 例阴道分娩产妇中,180 例发生顽固性PUR(顽固性PUR 组),发生率47.37%,未发生顽固性PUR 200 例(52.63%),作为对照组。单因素分析显示,顽固性产后PUR与总产程时间、第一产程时间、第二产程时间、分娩镇痛、产钳助产、会阴侧切伴裂伤及巨大儿有关(P<0.05),见表1。

表1 影响顽固性PUR的单因素分析结果

2.2 阴道分娩产妇发生顽固性PUR 的3 种风险预测模型的构建 以产妇是否发生顽固性PUR(是=1、否=0)作为因变量,将单因素分析中差异有统计学意义的变量分别纳入列线图、决策树和随机森林模型。对分类资料进行赋值[产钳助产(是=1、否=0),会阴侧切伴裂伤(是=1、否=0),巨大儿(是=1、否=0)],连续变量:产程时间、第一产程时间、第二产程时间、分娩镇痛时间,以实际值录入。

2.3 列线图模型 基于多因素Logistic回归分析中筛选出的危险变量,用70%样本量构建产妇发生顽固性PUR 的列线图预测模型,见图1。预测模型的临床应用示例:1 位阴道分娩产妇,总产程时间为13.5 h(32 分),第一产程时间560 min(86 分),第二产程80 min(50 分),分娩镇痛使用时间350 min(30分),有使用产钳助产(22 分),有会阴侧切伴裂伤(28分),巨大儿(16分),总分264分,对应发生顽固性PUR风险为72%。

图1 阴道分娩产妇发生顽固性PUR风险的列线图预测模型

2.4 决策树模型 模型结果显示,第二产程时间≥77 min的顽固性PUR发生率为30%,分娩镇痛时间≥327 min、第一产程时间≥526 min的顽固性PUR发生率为25%,第一产程时间≥568 min的顽固性PUR发生率为3%,总产程时间≥14 h的顽固性PUR发生率为6%,巨大儿的顽固性PUR发生率为11%,见图2。

图2 阴道分娩产妇发生顽固性PUR风险的决策树预测模型

2.5 随机森林模型 根据构建的最佳模型总体预测准确度变化,影响产妇发生顽固性PUR的变量排序分别是第二产程时间、第一产程时间、总产程时间、分娩镇痛时间、会阴侧切伴裂伤、巨大儿、产钳助产,见图3。

图3 阴道分娩产妇发生顽固性PUR 风险的随机森林预测模型:输入变量重要性测度

2.6 3种模型性能比较 使用验证集对3种模型进行效能验证,结果显示,列线图模型在实际患者识别发生顽固性PUR 效能方面优于决策树和随机森林模型,列线图模型的准确度为0.833,灵敏度为0.933,特异度为0.759,召回率为0.900,精确率为0.806,AUC为0.902,均高于决策树模型和随机森林模型,见表2。

表2 列线图、决策树与随机森林模型预测效能比较

3 讨论

随着临床医学研究信息不断膨胀,数据呈现多样化发展,传统的数据分析方法和工具难以满足当前临床需求,对于繁杂、大规模的医学数据信息,机器学习算法更具优势。本研究利用本院医院信息系统病历数据,分别构建列线图、决策树和随机森林用于预测阴道分娩产妇发生顽固性PUR 风险识别模型,在一定精准度上选择最优的预测模型,以更好地服务临床。

阴道分娩过程中,若产程时间过长,胎儿对阴道造成的压迫时间也有所增加,致使盆底肌肉和神经在不断拉伸下损伤,逼尿肌未能正常舒张、收缩而发生PUR[7]。随着总产程时间的推移,阴道分娩产妇发生顽固性PUR 的风险显著增加[8];而第一产程时间的延长会使阴道持续受压,对膀胱和尿道造成持续性压迫,产妇盆骨神经功能被抑制而增加了顽固性PUR 的发生风险[9]。第二产程时间超过1 h也是引发PUR 的危险因素,会时膀胱、尿道黏膜及尿道口充血、水肿,最终致使产妇顽固性PUR 发生。分娩镇痛虽然能够有效减轻产妇分娩过程中的疼痛感、提高分娩质量,但该法会延迟神经组织和盆底局部组织受到压迫的时间,致使产妇排尿信号受影响[10],而镇痛剂量的加大会导致分娩镇痛时间和排尿传导信号的影响时间延长,影响正常排尿,导致顽固性PUR 发生[11]。既往研究证实,会阴侧切和会阴裂伤与PUR发生呈正相关关系[12-13]。本研究结果显示,会阴侧切伴裂伤程度越重,顽固性PUR 风险越高。会阴侧切伴裂伤引起的疼痛和水肿程度也影响反射性尿道痉挛,并间接反映了阴道分娩的困难程度。Polat等[14]研究表明,产钳助产过程中可能会损伤盆腔神经、肛门括约肌等,延长膀胱受刺激时间,造成产妇自主排尿反射障碍。产钳助产具侵入性,会致使生殖道机械性阻塞、膀胱创伤而引起顽固性PUR[15]。巨大儿可能会延长产程时间、提高会阴侧切及产钳助产率,巨大儿对于膀胱以及盆腔神经的压迫更剧烈,产妇产后发生严重的组织水肿而导致排尿困难或无法自主排尿[16],本研究提示巨大儿是发生顽固性PUR的独立危险因素。

随着计算机软件和人工智能的发展,机器学习已成为医学界研究的新方向,能够从大样本数据集中筛选出更有效数据,并做出准确预测或决策,为患者带来更为准确和个性化的诊疗。研究显示,采用机器学习算法预测模型预测钢铁工人颈动脉粥样硬化发生情况[17]。通过机器学习可预测软骨肉瘤患者的肺转移风险[18]。本研究将差异有统计学意义的7 项指标分别纳入列线图、决策树和随机森林算法并建立预测模型,经验证,列线图模型在实际患者识别发生顽固性PUR 效能方面优于决策树和随机森林模型,列线图模型的准确度、灵敏度、特异度、精确率和AUC均高于决策树模型和随机森林模型。此外,在测试集中发现,随机森林模型的预测性能均低于训练集,说明随机森林模型存在过拟合现象,也可能是训练集数据不足而出现泛化效果较差。可见,列线图模型的预测效果更为理想,其诊断价值均优于决策树模型与随机森林模型,且列线图可将Logistic回归或Cox回归可视化,临床医师可以简单、便捷的估算出产妇发生顽固性PUR 的风险。

本研究局限性在于:本研究为单中心回顾性研究,受时间及样本量限制,可能存在一定的偏倚;本研究没有分析更多的顽固性PUR 发生风险特征与危险因素。在未来的研究中将使用更大、更全面的样本集,并采用多中心研究对本研究中的模型进行改进与验证,以进一步构建更为完善的预测模型。

综上所述,列线图模型在阴道分娩产妇发生顽固性PUR中具有较好的预测效果和稳定性,其预测效能优于决策树预测模型和随机森林模型,具有较好的临床应用价值。

猜你喜欢
顽固性线图决策树
缬沙坦联合氨氯地平片在老年顽固性高血压病人中的临床应用
一些图运算的调和指标与调和多项式的线图∗
预测瘢痕子宫阴道试产失败的风险列线图模型建立
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
一类图及其线图的Wiener指数
决策树在施工项目管理中的应用
针刺配合穴位埋线治疗顽固性面瘫63例
菖远安眠汤治疗顽固性失眠60例
旋降汤治疗顽固性梅核气27例