基于ARIMA和GM(1,1)模型的互联网肿瘤专科门诊接诊现状预测研究

2024-03-09 07:55徐彦杰刘俊卿李世云王若臻董恒磊

现代医院 2024年2期

徐彦杰辛亮刘俊卿李岩李世云王若臻董恒磊

天津医科大学肿瘤医院//国家肿瘤临床医学研究中心//天津市“肿瘤防治”重点实验室//天津市恶性肿瘤临床医学研究中心天津 300060

近年来,随着“互联网+医疗健康”的深入推进,互联网医院得到了蓬勃发展,不仅打破了传统医疗服务的时间和空间限制,而且对构建以患者为中心的医疗模式具有重要意义。然而,我国互联网医院的建设仍然面临着多重挑战和困境,部分互联网医院建设运营难以持久,国内的互联网医院研究也主要关注互联网医院的推广,而对互联网运行现状研究尚未有详尽报道。为更有效地推动互联网医院高质量发展,本研究将以某肿瘤专科医院互联网门诊接诊现状数据为基础,建立ARIMA模型和GM(1,1)模型,旨在准确预测互联网门诊接诊的变化趋势,以便更好地配置医疗资源,精准优化管理措施,为人民群众带来更多便利。

1 资料与方法

1.1 资料来源

研究数据来源于某肿瘤专科医院2021年1月—2023年6月互联网门诊接诊数据报表。

1.2 研究方法

1.2.1 ARIMA模型

自回归移动平均模型(autoregressive integrated moving average)简称ARIMA(p,d,q) 模型,其中AR是表示自回归,MA表示滑动平均,p为自回归项数,q为滑动平均项数,d代表差分次数。建模过程包含以下几个步骤:首先,验证序列的平稳性,并对不平稳序列进行对数变换和差分处理使其平稳;其次,进行模型识别,绘制自相关图和偏自相关图来确定阶数,提供初步的模型;然后,进行参数估计和模型诊断,检验各参数的统计学意义,检查残差是否为白噪声序列;最后,进行预测,将确定的最优模型应用于实际预测[1-2]。

1.2.2 GM(1,1)模型

GM(1,1)模型是建立在原始数据序列基础上的微分方程模型。该模型通过后验差比值C和小误差概率P来评估预测的准确性。建模过程包括以下步骤:首先,计算原始数据序列x(0)的一次累加序列x(1);其次,建立矩阵B和向量y;然后,求逆矩阵(BTB)-1;接下来,根据μ=(BTB)-1BTy计算估计值α和μ,使用时间响应方程计算拟合值α(-1)(i),进行后退运算还原;最后,进行精度检验和预测[3-4]。

1.3 评价指标

本研究采用平均绝对误差(mean absolute error, MAE)和均方根误差(root mean square error, RMSE)作为评价指标,用于比较ARIMA模型和GM(1,1)模型的预测结果。

(1) 平均绝对误差(MAE):

(2) 均方根误差(RMSE):

1.4 统计学方法

本研究使用OFFICE 2022对2021年1月—2023年6月互联网门诊接诊比例与互联网门诊人次占线下门诊比例进行统计;使用R软件建立ARIMA与GM(1,1)模型;使用统计学方法进行检验和评估,检验水准α=0.05。

2 结果

2.1 互联网门诊接诊比例与互联网门诊人次占线下门诊比例基本情况

2021年1月—2023年6月,互联网门诊接诊比例与互联网门诊人次占线下门诊比例呈波动上升趋势,相较于2021年1月,2023年6月互联网门诊接诊比例增加了14.25%,年均增长率5.70%;互联网门诊人次占线下门诊比例增加了13.72%,年均增长率5.49%。见图1和图2。

图2 2021年1月—2023年6月互联网门诊人次占线下门诊比例变化趋势

2.2 ARIMA模型结果

2.2.1 原始数据处理和平稳性检验

通过对原始数据进行处理和平稳性检验,发现门互联网诊接诊比例X和互联网门诊人次占线下门诊比例Y均为非稳定序列,进行差分平稳化。D(X)序列一阶差分、D(Y)序列一阶差分后ADF检验P值小于0.05,表明序列已平稳。见表1和表2。

表1 互联网门诊接诊比例(X)序列平稳性检验结果

表2 互联网门诊人次占线下门诊比例(Y)序列平稳性检验结果

2.2.2 模型参数确定

对于序列D(X),经过差分运算后已成为平稳序列,为确定最优模型,使用赤池信息准则(AIC)和贝叶斯信息准则(BIC),综合比较均方根误差(RMSE)、AIC和BIC,从中选取参数值,最终得到最优模型ARIMA(1,1,2)。通过最小二乘法对D(X)序列进行参数估计,得到如下模型:Δyt=0.7292Δyt-1+εt-1.7639εt-1+εt-2。见表3。

表3 互联网门诊接诊比例ARIMA模型检验

同理D(Y)序列的原始序列经过差分运算后已成平稳序列,根据赤池信息准则(AIC)和贝叶斯信息准则(BIC)选取最优参数值,通过综合比较均方根误差(RMSE)、BIC和AIC最小者,获得最优模型ARIMA(0,1,1)。通过最小二乘法对模型D(Y)序列进行参数估计,模型为Δyt=0.0047+εt-0.3719εt-1。见表4。

表4 互联网门诊人次占线下门诊比例ARIMA模型检验

2.2.3 模型的白噪声检验

对拟合模型残差序列进行白噪声检验就是检验其适应性,若序列不是白噪声则表明仍有信息未提取。通过画QQ与其加线图的拟合度来判断残差是否服从正态分布,然后再对拟合模型的残差白噪声检验进一步判断残差之间是否相关。

互联网门诊接诊比例采用拟合模型ARIMA(1,1,2)生成残差序列的QQ与其加线图。见图3。模型的残差服从正态分布且Ljung-Box检验P值为0.72,大于0.05,残差序列不存在自相关,为白噪音,因此,该模型是适合的模型。

图3 互联网门诊接诊比例ARIMA模型的QQ与其加线图

2.2.4 模型预测

根据以上检验结果,可以得出结论:ARIMA模型能够准确地拟合原始数据。分别采用ARIMA(1,1,2)和ARIMA(0,1,1)模型对2021年1月—2023年6月互联网门诊接诊比例与互联网门诊人次占线下门诊比例进行预测,残差在0上下浮动,这表明拟合值与实际值相近。预测结果见表5。

互联网门诊人次占线下门诊比例采用拟合模型ARIMA(0,1,1)生成残差序列的QQ与其加线图,见图4。模型的残差服从正态分布且Ljung-Box检验P值为0.23,大于0.05,残差序列不存在自相关,该序列为白噪音序列,该模型是适合的模型。

图4 互联网门诊人次占线下门诊比例ARIMA模型的QQ与其加线图

2.3 GM(1,1)模型结果

通过灰色GM(1,1)预测模型的建模步骤,得到互联网门诊接诊比例的灰色预测模型表达式如下:

对预测模型进行精度检验,方差比C检验为0.300 2,小概率误差P为0.966 7,表明预测精度等级为好,因此该模型可用于预测某肿瘤专科医院互联网门诊接诊比例。

同样地,建立互联网门诊人次占线下门诊比例的灰色预测模型表达式如下:

对预测模型进行精度检验,方差比C检验为0.181 8,小概率误差P为0.999 9,表明预测精度等级为好,因此该模型可用于预测某肿瘤专科医院互联网门诊人次占线下门诊比例。

采用上述GM(1,1)模型对2021年1月—2023年6月互联网门诊接诊比例与互联网门诊人次占线下门诊比例进行预测,预测结果见表6。从表可知,互联网门诊接诊比例实际值与预测值结果的残差多大于0,说明拟合值总体小于实际值;互联网门诊人次占线下门诊比例实际值与预测值结果的残差多小于0,说明拟合值总体大于实际值。

2.4 评价指标比较

通过比较模型的平均绝对误差MAE、均方根误差RMSE两个误差指标可见,ARIMA模型比GM(1,1)模型误差值小,因此ARIMA模型更适用于互联网接诊现状的预测。见表7。

表7 模型预测效果比较

3 讨论

3.1 接诊现状指标的选取和意义

互联网门诊接诊比例指医生接诊人次占患者挂号人次的比例,此项指标受多种因素的影响,一方面是患者挂号后经医生评估不适宜在互联网就诊,医生给与主动退号处理;另一方面是在规定的接诊时间内,医生没有及时接诊系统自动退号处理。通过监测此项指标,①有助于医院加强智能导诊功能建设,引导患者准确找到相应学科医生及时就医;②有助于医院制定相应政策并加强互联网门诊管理,提升医生接诊的积极性,降低退号比例。互联网门诊人次占线下门诊比例主要反映线上线下医疗服务融合程度及互联网门诊应用的规模,用于评估互联网医疗服务推广应用情况,通过监测此项指标,有助于医院及时调整互联网医疗服务策略和优化医院资源配置。同时,互联网门诊接诊比例和互联网门诊人次占线下门诊比例会随着互联网技术的发展和普及而发生变化,因此,医院需要建立持续的监测机制,全面地掌握互联网门诊接诊现状,助力医院制定更具针对性的战略和政策,以满足患者和医生的需求,推动互联网医院高质量发展。

3.2 ARIMA与GM(1,1)模型比较

在医学领域,时间序列分析模型扮演着重要角色,其中ARIMA模型和GM(1,1)模型在疫情预测、疾病发展预测、药物销售预测以及医疗资源优化等领域的预测广受欢迎[5-6]。针对这两个模型,本研究以某肿瘤专科医院2021年1月—2023年6月的数据为基础,分别运用ARIMA和GM(1,1)模型,预测了互联网门诊接诊比例以及互联网门诊人次占线下门诊的比例,并对预测结果进行深入比较与分析。实证研究显示,在互联网门诊接诊比例预测中,ARIMA模型和GM(1,1)模型表现相近,平均绝对误差分别为2.06%和2.41%,均方根误差则分别为3.01%和3.17%。在互联网门诊人次占线下门诊比例的预测中,ARIMA模型显著优于GM(1,1)模型,平均绝对误差为0.58%,后者为1.08%,对应的均方根误差分别为0.75%和1.31%。这一结论与过去的研究一致,再次证实了ARIMA模型在预测精度上的优势[7-10]。

在对比两个模型的预测结果时,可以明显地观察到ARIMA模型具有更高准确性。这一优越性源于ARIMA模型精妙地结合了自回归和移动平均的方法,从而更好地捕捉数据的趋势和季节性变化。相反,尽管GM(1,1)模型运用了灰色理论,考虑了数据的发展趋势,但对于较为复杂的时间序列数据,其预测精度显然不及ARIMA模型[11-20]。

3.3 某肿瘤专科医院互联网门诊接诊现状分析与预测

本研究采用ARIMA模型对互联网接诊现状进行预测,2023年12月,互联网门诊接诊比例为90.35%,互联网门诊人次占线下门诊的比例将达16.46%。从整体趋势来看,2021—2023年某肿瘤专科医院互联网接诊比例呈现持续稳定趋势,互联网门诊人次占线下门诊比例呈现持续上升的趋势。这一结果受多种因素影响,包括互联网医疗服务的逐步完善和普及、信息技术快速发展、患者行为和态度的变化、新冠疫情爆发的影响、法规政策和医疗体系的支持等。互联网门诊接诊比例通过前期管理,已经达到相对稳定趋势。未来,随着互联网医院的建设逐渐完善,互联网医疗服务将更好地满足了患者需求,互联网门诊人次占线下门诊比例将呈现逐步上升趋势。