大数据环境下居民对个人医疗信息被访的容忍度研究

2021-03-02 05:52吴丁娟
医学与社会 2021年2期
关键词:容忍度信任度敏感度

吴丁娟

广州医科大学卫生管理学院,广东广州,511436

医疗信息承载大量患者隐私,涉及内容非常广泛和敏感。电子信息的记忆性和共享性日益凸显出共享医疗数据的伦理与隐私保护的伦理在价值方式、技术方式上同时呈现的矛盾[1]。为了实现医疗信息开发的同时兼顾隐私保护,很多学者致力于通过技术限制访问[2-3]。但是,出于生命健康权益的考虑和医疗大数据价值的追求,医疗信息依然会在多种用途下被访问和共享[4]。

从隐私主体立场,学者们对隐私泄露容忍度进行了探讨。容忍度和风险关系密切,Grable将金融风险容忍度定义为决策者所愿接受的最大程度的不确定性[5]。借鉴此定义,李睿指出隐私泄露容忍度是用户对隐私泄露的接受程度[6]。Carducci等表明心理和个体因素测试可以探究个体的风险容忍度及其影响因素[7],问卷调查比较适于研究容忍度。利用问卷,易红等得出图书馆用户隐私泄露容忍度低的结论[8],李睿也指出移动互联用户呈现隐私泄露风险厌恶倾向[6]。既有文献表明了网络用户的隐私泄露容忍度不高,然而,基于患者视角对医疗隐私泄露容忍度的相关研究尚不多见。医疗信息应用场景比较特殊,隐私独享和信息共享的冲突更为明显。多变访问场景和非固定访问目的下,设计合情合理合法的医疗信息访问策略十分重要,因此,深入了解民众的个人医疗信息被访敏感度和容忍度迫在眉睫。

1 资料来源与方法

1.1 研究对象

由于研究主题涉及到医疗数据,要求受访者对大数据有初步认识,所以,本次调查的目标总体界定为18-55岁的居民。于2019年9-10月,采取两阶段抽样法,先利用随机抽样在广州市选取了天河区、越秀区、番禺区、荔湾区4个行政区,然后利用便利抽样法在4个区发放问卷295份,剔除填写不完整、逻辑混乱、填写错误等无效问卷,保留有效问卷244份,有效回收率为82.7%。

1.2 研究方法

依据研究目的,首先查阅了相关文献并进行资料整理,然后,分别访谈一名医生和居民,了解当前医院对医疗数据的管理和使用现状,居民对隐私保护与医院权限的理解和态度,以及医生和居民的各自立场和顾虑。最后,基于文献研究和访谈结论来设计问卷,经过专家咨询、小范围测试和题项分析方法,得到预调查问卷。预调查共发放53份问卷,效度和信度良好,为正式调查问卷的发放奠定基础。调查问卷主要包括5方面内容。

1.2.1 居民对隐私的关注度。采用非平衡量级的单选题进行测量,1-4分别代表不关注、一般、关注、非常关注,分数越高,关注度越高。

1.2.2 居民对医院的隐私保护工作的信任度。基于医疗数据在医院的流转程序,分别从医疗数据的收集、使用、访问、存储和转让5个工作情境的医疗隐私保护入手,利用Likert 5级量表测量居民对医院隐私保护的信任态度,分为非常不信任、不信任、一般、信任、非常信任5个级别,分数越高,信任度越高。

1.2.3 居民对不同医疗信息隐秘性的敏感度。敏感度表现为居民对不同医疗信息隐私保护的重视程度,参考贺旭设计的医疗信息指标[9],筛选出具有一定敏感性的9个典型指标:机器检查图像信息,住院信息(床号、门诊号、住院号、入住时间天数等),治疗信息(主要病史、化验结果、治疗期间病情变化、手术方式、使用药物等),劳动力鉴定(伤残情况),整容信息,传染疾病信息,精神疾病信息(神经衰弱、强迫症、抑郁症等),家族遗传病史,DNA鉴定结果。利用Likert 5级量表,分为非常不重要、不重要、一般、重要、非常重要5个级别,分数越高,敏感度越高。

1.2.4 匿名信息被访容忍度和实名信息被访容忍度。由于患者就医诊疗过程中的医生和相关人员对于个人医疗数据的访问是必然且合理的,所以,对于医疗隐私被访容忍度的调查主要从其他非诊疗情境入手,包含非就诊的其他医生查看个人医疗信息、医学院作为案例展示给医学生、医学生在病史室翻阅病历进行学习、医院用于宣传疾病的治疗手段、制药公司做药物疗效跟踪记录、医疗保险公司统计数据制定医保策略6个题项设置。在身份是否能够识别的两种前提下,利用Likert 5级量表测量匿名信息被访和实名信息被访容忍度,分为非常不同意、不同意、一般、同意、非常同意5个级别,分数越高,容忍度越高。

1.2.5 个人信息。为了分析个人特征与医疗隐私被访容忍度的关系,设置了性别、年龄、学历、职业等题项。

1.3 信度和效度分析

利用SPSS 19.0对数据进行信效度分析,总量表和各个分量表的信度系数都满足Cronbach's alpha大于0.8,表明量表内部一致性非常理想,量表信度较高。KMO值均大于0.8,Bartlett球形检验P<0.001,表明变量适合进行因子分析。采用主成分分析法配合最大差异法旋转得到4个因子,信任度、敏感度、匿名信息被访容忍度、实名信息被访容忍度4个构念分属于4个因子,且在分属因子上的最低因子载荷量为0.672,累积解释总方差73.0%,可以认为萃取的4个因子是非常适切的。结合咨询专家的内容效度和表面效度检验,问卷的可靠性和有效性可以得到验证。见表1。

表1 量表的信度和效度分析

1.4 统计学方法

用SPSS 19.0软件进行统计分析,主要使用独立样本t检验、配对样本t检验、方差分析、多重比较及线性回归分析等方法。

2 结果

2.1 调查对象基本情况

调查对象中,男性134人(54.9%),女性110(45.1%),其中18-35岁124人(50.8%),36-55岁120人(49.2%)。比例基本均衡,职业和学历的分布也基本符合广州市的现状。见表2。

表2 样本基本信息与被访容忍度

2.2 基本数据描述

医院在信息流转过程中隐私保护工作的信任度方面,总信任度为(3.13±0.82),各类场景下隐私保护工作的信任度排序如下:转让信任度(2.94)<收集信任度(3.14)<使用信任度(3.15)<访问信任度(3.17)<存储信任度(3.24)。其中,过渡数据给第三方的隐私保障是最不被认可的。

医疗信息保护的敏感度方面,总敏感度为(4.25±0.66),各类医疗信息的敏感度排序为:传染病(4.41)、家族遗传病史(4.41)> DNA鉴定结果(4.39)>精神疾病信息(4.33)>整容信息(4.27)>治疗信息(4.2)>劳动力伤残鉴定(4.16)>住院信息(4.11)>机器检查图像信息(3.98)。

信息被访的容忍度方面,匿名和实名信息被访容忍度分别为(2.80±0.88)、(2.09±0.90),6个情境下的匿名信息和实名信息被访容忍度分别为:非就诊的其他医生查看医疗信息(2.93/2.38)、医学院作为案例展示给医学生(2.90/2.04)、医学生在病史室翻阅病历学习(2.84/2.09)、医院用于宣传疾病的治疗手段(2.43/1.80)、制药公司做药物疗效跟踪记录(2.90/2.14)、医疗保险公司统计数据制定医保策略(2.81/2.12)。无论是否匿名,医院用于宣传疾病治疗都是最不被接受的一种隐私访问方式。匿名信息被访容忍度趋于中立,实名信息被访容忍度普遍偏低,以不同意个人医疗信息被访为主要态度。

通过Q-Q图和P-P图的观察,结合单样本K-S检验,可以接受匿名被访容忍度、实名被访容忍度、两个容忍度之差值都服从正态分布的假设。

2.3 身份信息是否被识别的容忍度差异分析

容忍度差值定义为匿名被访容忍度-实名被访容忍度,数据有正有负,检验得到容忍度差值满足正态分布。利用配对样本t检验验证结论:相比于匿名信息被访,实名信息被访时居民的容忍度显著降低。见表3。

表3 信息被访容忍度的配对样本t检验

2.4 不同特征人群的容忍度差异分析

利用独立样本t检验和单因素方差分析,分析不同人群容忍度的差异,并对有差异的组别进行S-N-K多重比较。基于表4的差异分析和表5的多重比较分析,可以得出:①匿名信息被访容忍度在性别、年龄、学历上无显著差异,实名信息被访容忍度在性别、年龄、职业上无显著差异;②企业员工、自由职业者及其他类型人员的匿名信息容忍度显著低于公务员、事业单位工作人员和大学生,但是无论何种职业的实名信息被访容忍度都没有显著差异;③实名信息被访容忍度普遍偏低,高中及以下学历居民的实名信息被访容忍度显著高于更高学历的居民。

表4 容忍度差异分析

表5 医疗信息被访容忍度多重比较

2.5 实名信息被访容忍度影响因素分析

结合相关分析和差异分析方法,得到匿名信息被访容忍度除了与职业有关之外,与关注度、信任度、敏感度以及其他个人特征都没有显著相关性,表明职业类别是匿名信息被访容忍度差异的主要原因。同样,实名信息被访容忍度与关注度、信任度、敏感度、匿名信息被访容忍度、学历都显著相关,利用线性回归分析进一步探讨实名信息被访容忍度的影响因素。设置虚拟变量edu1、edu2代表学历,变量说明和线性回归分析结果见表6、表7。

表6 变量说明

表7 实名信息被访容忍度的回归分析

为了保证学历变量的同进同出,使用进入法纳入变量。依据表7的数据,回归方程显著,所有自变量对因变量的影响都显著。调整后R2=0.38,表明自变量解释了因变量38%的变异。DW值=2.32,表明没有严重的自相关现象。VIF值在1.04-3.64,表明没有明显的共线性。由此,实名信息被访容忍度的回归方程为:

Y=2.73-0.16X1+0.20X2-0.36X3+0.43X4-0.51edu1-0.51edu2

回归方程表明:①隐私关注度、敏感度、学历负向影响实名信息被访容忍度,对医院隐私保护工作的信任度、匿名信息被访容忍度正向影响实名信息被访容忍度;②各个因素对实名信息被访容忍度影响力大小的排序为:匿名信息被访容忍度>敏感度>学历>信任度>关注度;③以高中及以下学历为基准,控制其他变量不变的情况下,更高学历的实名信息被访容忍度都会降低0.51个点。

3 讨论

3.1居民对医院信息保护工作的信任度较高,对第三方机构的数据共享持有质疑

在医院信息保护工作中,居民对于信息的收集、使用、访问、存储的隐私保护信任均值基本持平于3.14-3.24之间,转让数据给第三方机构的隐私保护信任度均值为2.94。说明民众对于医院的信誉是持比较乐观的态度,但是对于第三方机构在数据共享下的隐私保护怀有质疑。因此,规范医院自身的数据管理有利于医院形象的维护和塑造,特别是和第三方机构合作进行数据开发时要充分考虑隐私保护并做好隐私保护工作,提升民众对医院的信任。

3.2 居民重视医疗信息的隐私保护

居民对各类医疗信息隐私保护的整体敏感度为(4.25±0.66),表明对于带有敏感性的医疗信息,居民认为隐私保护工作十分重要。各类医疗信息的敏感度均值位于区间3.98-4.41,区间长度为0.43。如果从最低敏感度的3.98开始,每隔0.15分为一个等级,即3个等级的隐私保护敏感度分别为(3.98-4.13)、(4.14-4.29)、(4.3-4.45),那么,一级保密的依次是传染病、家族遗传病史、DNA鉴定结果、精神疾病信息,二级保密的是整容信息、治疗信息、劳动力伤残鉴定信息;三级保密的是住院信息、机器检查信息。本研究对于医疗信息的分级结果和娄培的医疗数据分级结果进行对比[10],虽然内容有差异,但是重合部分信息的级别顺序是吻合的,依据居民感知的隐私敏感度进行隐私访问权限的分层控制或能有助于降低隐私纠纷。

3.3 身份能够识别的医疗信息被访容忍度极低

数据分析结果显示,匿名信息被访容忍度接近于“一般”的态度,实名信息被访的主要态度为“不同意”,表明了在非就医情形下的信息被访是不被接纳的。其中,医院用于宣传疾病的治疗手段是最不被接受的一种隐私访问方式。因此,医疗信息超出正常隐私让渡范围时,医疗机构须争取患者知情同意,特别是涉及个人身份信息时,更应该在隐私保护的范畴之下进行,以免引起隐私权纠纷,引发医患矛盾。另一方面,虽然现在医疗机构在数据隐私保护上都充分体现了匿名原则,差强人意的匿名信息被访容忍度也为隐私共享留下了些许空间。然而,随着技术发展,人工智能的学习分析能力将可以透过医疗信息推导其他隐私[11],匿名医疗信息在技术上反向定位至个人也会成为必然。因此,隐藏身份标志的信息共享也可能会和实名信息共享一样陷入伦理困境。

3.4 实名信息被访容忍度将会越来越低

通过回归分析得到结论,居民的学历和对隐私的关注度都反向影响实名信息被访容忍度。一方面,当前学历高的居民容忍度低,反映了对大数据的认知越多,就越不能容忍隐私泄露,与易红对图书馆用户的调查结论一致[8],但是,随着大数据的应用不断拓展,即使学历低的民众对于大数据知识的理解也必将越来越深入。另一方面,各类隐私侵权事件的出现越来越强化人们的隐私意识,隐私保护的愿望也日益迫切,将带来隐私关注度的提升。如何一方面尊重个人隐私,一方面开发大数据医疗的巨大潜力,关于这个辩题的伦理思考和技术探讨任重道远。

猜你喜欢
容忍度信任度敏感度
全体外预应力节段梁动力特性对于接缝的敏感度研究
电视台记者新闻敏感度培养策略
英语专业不同感知风格者模糊容忍度与写作水平的关系
全球民调:中国民众对政府信任度最高
在京韩国留学生跨文化敏感度实证研究
模糊容忍度与专门用途英语阅读水平相关性研究
汽车养护品行业运行环境分析及提高客户信任度的途径
Diodes高性能汽车霍尔效应闭锁提供多种敏感度选择
口语产出质量与模糊容忍度的相关研究
2014,如何获得信任