中文版简短心理咨询和治疗评估表的开发及验证*

2022-03-20 07:27MarkStein张佳丽张建华刘兴兰谭小林
精神医学杂志 2022年4期
关键词:信效度修订版信度

黎 娅 袁 刚 Mark J Stein 张佳丽 张建华 杨 辉 邓 梅 刘兴兰 谭小林

我国正处于经济社会快速转型期,人们的生活节奏明显加快,心理健康问题日益凸显[1],2016年以来,国家卫健委等22部门联合发布的《关于加强心理健康服务的指导意见》[2]、《全国社会心理服务体系建设试点工作方案》[3]等文件中均提出要加大心理健康问题基础性研究,规范发展心理治疗、心理咨询等心理健康服务。2021年,国家心理健康和精神卫生防治中心的成立,对中国临床与咨询心理学领域而言是一个重要事件。在国家的政策指导下,心理咨询得以快速发展。由于心理咨询效果相关测评工具匮乏,在一定程度上限制了心理咨询效果的评价及相关研究工作的开展。如何有效客观评估心理咨询效果、多维度识别来访者心理状态,是心理咨询师及心理治疗师面临的一大挑战[4]。

在我国,常用的心理咨询效果评估工具有中国人健康问卷(Chinese Health Questionnaire,CHQ-12)、中文版临床疗效评估量表 (Clinical Outcomes in Routine Evaluation-Outcome Measure,CORE-OM)、心理咨询效果问卷(Outcome Questionnaire-45, OQ-45)等。CHQ-12是我国台湾学者郑泰安等于1985年在一般健康问卷(General Health Questionnaire,GHQ)的基础上结合中国文化特色研制出的量表,主要用于评估来访者的心理状态,研究表明其具有良好的信效度、敏感度及稳定性等,在我国台湾地区被广泛使用[5];但在Chong M等[6]的研究中显示该量表有效性系数在男性中普遍高于女性,在受教育程度较高的患者中,其有效性系数高于受教育程度较低的患者,后者更容易被归类为假阳性;且缺乏动态评估心理咨询效果的相关研究等,在我国大陆使用起来具有一定的局限性。CORE-OM是由Evans 等于1998年编制的临床疗效评估量表,包含34个条目,主要用于测量来访者的心理困扰,如焦虑、抑郁、睡眠障碍、人际交往问题等,也可用于衡量对自己或他人造成伤害的风险,在英国被广泛应用[7],自2020年引入中国,经过我国张小金等研究表明,CORE-OM用具有良好的信效度及重测信度[8];在使用过程中,由于其条目较多,对于部分来访者来说条目稍显繁琐,目前在我国并未大范围使用。OQ-45是Lambert MJ等[9]于1994编制的咨询效果评估工具,主要用于评估焦虑抑郁程度、人际关系问题等,信效度及敏感性较好,在美国被广泛应用于各种心理咨询机构;秦佑凤等[10]的研究表明该量表不符合三因素结构,其三因素的结构效度一直没有得到很好的验证;并且由于文化背景不同,OQ-45 在中国的使用还需要进一步的修订。

本研究创新引进由英国利兹大学的荣誉讲师和《心理治疗研究》的顾问编辑Jeremy Halstead博士编制的简短心理咨询和治疗评估表(shorter Psychotherapy and Counseling Evaluation,sPaCE)。英文版sPaCE是一种自我测量量表,只有19个条目,其因子结构清晰、信效度较高、对变化敏感,具有条目少、易于使用、简单等特点,在英国被广泛应用,主要用于测量焦虑和抑郁等的严重程度以及动态评估来访者的咨询效果,咨询师或治疗师可以通过该量表提高咨询效果评估的效率。在英国Halstead JE等[11]的研究显示该量表已被证明是一种有效的心理测量方法;相比CHQ-12、CORE-OM等量表,sPaCE具有条目少、敏感度高、信效度高、稳定性好、可动态评估咨询效果等特点,sPaCE已被翻译成多国语言,但目前缺乏中文版。重庆市精神卫生中心英国籍专家Mark博士获得sPaCE的版权,经翻译汉化后在中国人群中进行使用;sPaCE的跨文化应用是一个重要的、积极的发现,为国内首次引进使用。由于文化背景、认知体系等不同,中文版sPaCE是否能达到心理评测的要求,有必要对其信效度做进一步的研究。鉴此,本研究遵循量表编制的原则和方法[12],对中文版sPaCE进行编制和修订,并对其因子结构重新进行探索。

1 对象与方法

1.1 对象 样本1:用于中文初始版sPaCE的验证性因子分析、条目分析和探索性因子分析,进行条目的筛选和删除。采取便利抽样法,招募2019年10月~2020年06月重庆市精神卫生中心心理咨询中心的来访者,取得知情同意后共发放中文初始版sPaCE 336份,剔除有缺失值或明显反应偏向的无效问卷42份,最后获初测样本的有效问卷294份。其中男105名,女189名,平均年龄(28.10±8.77)岁。

样本2:用于中文修订版sPaCE的信效度检验和验证性因子分析。中文修订版sPaCE共有15个条目,结合研究资源和时间进度,根据吴明隆[13]教材中专家经验,以样本量是条目数的5~10倍计算,采取便利抽样法,招募 2021年5月~2021年07月重庆市精神卫生中心心理咨询中心的来访者,取得知情同意后共发放中文修订版sPaCE 145份,剔除有缺失值或明显反应偏向的无效问卷后,获得有效问卷123份。其中男32名,女91名,平均年龄(31.12±10.09)岁。

样本3:用于中文修订版sPaCE的重测信度。1周后从样本2中随机选取110名被试进行重测,剔除有缺失值或明显反应偏向的无效问卷后,获得有效问卷100份。其中男28名,女72名,平均年龄(30.03±9.08)岁。

本研究已获得学术伦理委员会的批准(2019伦审医字第004-1号)。调查前,告知研究对象自愿参与研究,研究中途可随时退出。并向其说明调查所得资料仅用于本次研究,研究过程不会影响其正常咨询治疗。

1.2 方法

1.2.1 研究工具

1.2.1.1 简短心理咨询和治疗评估表(sPaCE) 该量表是由Halstead JE等[11]编制的,共有19个条目,分为6因子(一般抑郁、自残性抑郁、一般焦虑、病态焦虑、功能性认知因子、冷漠因子)和4因子(抑郁因子、焦虑因子、功能性认知因子、冷漠因子)结构,量表按0~4级评分方法计分(0分完全没有,1分轻度,2分中度,3分重度,4分极重);总分越高,说明咨询个体感到痛苦的问题或困难越严重。在征得原作者授权后对该量表进行翻译及修订;先是根据中国文化背景及语言表达习惯,在保持条目意义不变的情况下,由2名精神科医生、3名心理学专家、3名非专业人员和1名专业英语翻译组成的团队把英文原文翻译成中文;然后该小组与来自英国常使用sPaCE的专家进行探讨,探讨了英汉翻译之间的差异,确定初测量表;最后,随机选择20名来访者对初测量表进行通俗度检验,最终形成与英文版量表条目和计分方法相同的中文初始版sPaCE,并加入指导语。

1.2.1.2 中国人健康问卷(CHQ-12) 包括躯体化、焦虑、社交障碍、抑郁4个因子, 按照世界卫生组织(WHO)的评分方法,采用 0-0-1-1评分方法,备选项目是:(1)一点也不;(2)和平时差不多;(3)比平时严重些;(4)比平时严重得多[14];即被试选择(1)或(2)在本调查中均记为0分,选择(3)或(4)在本调查中均记1分。因此12个条目的最低分为0分,最高分为1分。总分越高,说明来访者的焦虑抑郁程度越严重。

1.2.1.3 中文版临床疗效评估量表 (CORE-OM) 是由34个条目组成的自我测量量表,量表按0~4级评分方法计分(0分从不,1分偶尔,2分有时,3分经常,4分总是)。涵盖4个领域:幸福感(4项)、问题(12项)、功能(12项)、对自己和他人的风险(6项);是来访者对过去1周内状况的描述,总分越高,说明来访者感到痛苦的问题或困难越严重[7]。

2 结果

2.1 中文初始版sPaCE的验证性因子分析

2.1.1 中文初始版sPaCE(6因子结构)的验证性因子分析 样本1(6因子结构)的验证性因子分析结果显示,卡方值(χ2)=457.121,自由度(df)=137,卡方/自由度(χ2/df)= 3.337,标准适配指数(NFI)=0.916, 相对拟合指数(RFI)=0.896,增值适配指数(IFI)=0.940, 非规准适配指数(TLI)=0.925, 比较适配指数(CFI)=0.940, 简效规范适配指标(PNFI)=0.734, 简约适配度指数(PCFI)=0.753, 近似误差均方根(RMSEA)=0.089, 残差均方和平均根(RMR)=0.055, 拟合优度指数(GFI)=0.861, 修正拟合优度指数(AGFI)=0.807,简约适配度指数(PGFI)=0.621。平均方差抽取量(AVE)为0.641~0.798,组合信度(CR)为0.851~0.923。见表1。

表1 sPaCE中文初始版(6因子结构)的验证性因子分析(n=294)

2.1.2 中文初始版sPaCE(4因子结构)的验证性因子分析 样本1(4因子结构)的验证性因子分析结果显示:χ2=750.052,df=146,χ2/df=5.137,NFI=0.863, RFI=0.839,IFI=0.887, TLI=0.887, CFI=0.886, PNFI=0.737,PCFI=0.756, RMSEA=0.119, RMR=0.080, GFI=0.771, AGFI=0.701,PGFI=0.592。AVE值为0.641~0.684,CR值为0.876~0.928。见表2。

表2 sPaCE中文初始版(4因子结构)的验证性因子分析(n=294)

2.2 中文初始版sPaCE的条目分析 临界比值法的结果显示,所有条目在高、低分组间差异均有统计学意义(P<0.05),决断值在9.179~27.567之间。相关分析结果显示,19个条目与总分之间的相关系数在0.641~0.861之间,均有统计学差异(P均<0.001)。校正条目与总分相关系数在0.604~0.841之间,差异均有统计学意义(P<0.001)。删除条目的Cronbach’s α系数在0.964~0.967之间,删除因子后的Cronbach’s α系数均未增加。条目分析步骤未删除条目。

2.3 中文初始版sPaCE的探索性因子分析 结果显示,KMO检验值为0.954,Bartlett球性检验值为5 335.375,自由度为171,P<0.001,反映像相关矩阵的变量取样适当性量数(Measures of Sampling Adequacy,MSA)在0.181~0.554之间,说明所有条目均适合进行因子分析。经过4次探索性因子分析,最终形成结构清晰的2个因子共包含15个条目的中文修订版sPaCE。见表3。15个条目的共同度在0.432~0.893之间,旋转后的各条目在相应的因子载荷为 0.617~0.880,2个因子共能解释71.633%的总方差变异。见表4。

表3 中文修订版sPaCE

2.4 中文修订版sPaCE的信效度检验

2.4.1 内部一致性信度 以量表的Cronbach系数和分半信度为评价量表一致性信度的指标,中文修订版sPaCE总的Cronbach’s α系数为 0.957,分半信度为0.928。各因子的Cronbach’s α系数为0.924~0.956,分半信度为0.925~0.951。见表5。

2.4.2 重测信度 一共有123名的来访者进行首次中文修订版量表评估,评定总分为(23.64±8.69)分;1周后的首次治疗前对再次来访的100名予以量表评定,总分为(21.25±8.24)分,计算得出的重测信度为R=0.715(P<0.001)。

表4 中文修订版sPaCE各条目因子载荷

表5 中文修订版sPaCE的信度分析(n=123)

2.4.3 效度检验

2.4.3.1 验证性因子分析 样本2(2因子15条目结构)的验证性因子分析结果显示:χ2=333.393,df=89,χ2/df= 3.746,NFI=0.917,RFI=0.902,IFI=0.938, TLI=0.926, CFI=0.937, PNFI=0.777, PCFI=0.794, RMSEA=0.097, 残差均方和平均根(RMR)=0.052, GFI=0.862, AGFI=0.814,PGFI=0.640。各条目的标准化因子载荷为0.623~0.939。见表4。AVE最小值接近0.700,CR均>0.900,两个因子间相关性系数为0.680,小于AVE值的平方根0.899和0.804。见表6。

表6 中文修订版sPaCE(2因子结构)的验证性因子分析(n=123)

2.4.3.2 效标效度 中文修订版sPaCE总分与CHQ-12总分的相关系数为0.838(P<0.001);与CORE-OM的相关系数为0.903(P<0.001)。

3 讨论

编制一个新量表往往需要数年以至数十年的时间,故多采用前人已编制好的量表,但种族、文化、样本量、时代变迁、人群等因素可能导致量表的信效度会发生改变,需要对量表进行重新修订和测验信效度后再使用。本研究引进英文版SPaCE进行翻译汉化、专家咨询讨论及通俗度检验,形成与英文版量表条目和计分方法相同的中文初始版sPaCE 19个条目。

通过样本1分别对中文初始版sPaCE的6因子结构和4因子结构进行验证性因子分析,6因子结构的模型拟合指标较为满意,但4因子结构的模型拟合指标不能令人满意。在6因子和4因子结构中,所有的组合信度(CR)均大于0.7,表示因子内的条目向因子的聚合效度较好,但无论是6因子结构还是4因子结构,因子间的相关系数均较高,且明显大于相应AVE值的平方根值,这表明量表内不同因子间缺乏独立性,原来的因子结构维度间不能进行很好的区分,这不符合心理测量学的要求。文化及种族差异、样本量纳入不同等因素,可能是导致本研究结果与国外研究不同的原因。

本研究遵循量表编制的原则和方法[12],先后采用量表总分高、低分组临界比值决断法(Critical Ration,CR)、相关分析法、内部一致性分析对中文初始版sPaCE进行条目分析筛选并检验各条目的区分度,但条目分析步骤未能删除条目。该步骤说明中文初始版所有条目的区分度较好,最小的决断值也在9.179,远远大于一般认为的3.5或者4.0,相关系数也大于0.4,中文初始版sPaCE的信度应该是令人满意的,但本研究并未对此再做重复性研究。重要的是,本研究采用探索性因子分析方法,删除了中文版条目4、10、11、16,经过4次探索性因子分析,最终保留了2个公因子(自杀自伤和其他),形成了中文修订版sPaCE。一般认为,如果提取的公因子能解释>50%的变异,且各条目在因子上的载荷>0.400,即可认为该测量具有较好的结构效度[20]。本研究结果显示,15个条目的共同度在0.432~0.893之间,旋转后的各条目在相应的因子载荷均较大(0.617~0.880),形成结构清晰的2个因子,共能解释71.633%的总方差变异,能够满足心理测量学的要求。单从拟合指标来讲,修订后的2因子结构与修订前的6因子结构的拟合指标相似(χ2/df=3.746、3.337),验证性因子分析的拟合指标和探索性因子分析的拟合指标也达到了要求,修订后各条目的标准化因子载荷为0.623~0.939,均说明结构效度很好。

通过样本2对中文修订版2因子15条目结构的验证性因子分析结果显示,AVE最小值接近0.700,CR均>0.900,两个因子间相关性系数为0.680,小于AVE值的平方根0.899和0.804,说明因子内的条目向共同因子聚合的程度较高,2个因子间具有独立性,并且能够进行很好的区分,弥补了中文版sPaCE 19个条目各因子间缺乏区分度的不足。效标效度又称效标关联效度,是指与其他可以测量该内容的成熟量表的相关性。本研究采用CHQ-12及CORE-OM进行相关性研究,结果显示中文修订版sPaCE与CHQ-12及CORE-OM的相关系数很高(r=0.838、0.903),说明其效标效度良好。

信度是评价量表的稳定性、一致性、精确度的指标[21],表示量表测量结果的可靠性和可信性。如果量表总的Cronbach’s α系数>0.800,量表各因子的Cronbach’s α 系数>0.600,表明该量表各条目内部一致性信度良好[22,23]。本研究中修订版sPaCE总的Cronbach’s α系数为 0.957,量表各因子的Cronbach’s α系数为0.924~0.956,说明该量表内部一致性信度良好。重测信度是指用同一个量表对同一组被试先后两次测查所得结果的关系系数,反映了测验分数的稳定程度。本研究中,重测信度为R=0.715,提示相关程度高,表示该量表前后测量一致性高,稳定性好,可以作为预测被试将来行为表现的依据。需要注意的是,重测信度只适用于那些不会随时间的变化而改变的特质。

总之,通过开发和验证,sPaCE的翻译和修订是成功的,中文修订版的2因子15条目结构清晰、量表信效度高、对变化敏感[19,24]。该量表能动态评估心理咨询和治疗效果,可以在咨询治疗过程中任一阶段使用,具有和前次评分做对比判断咨询治疗效果的能力。由于其条目少、费时少、评分简便等优点,相信该中文版量表能在我国很好地推广和应用。不足之处,本研究样本量偏少,并且没有纳入非临床样本进行对比分析,有待今后的研究中扩大样本的覆盖面进行检验和使用。

猜你喜欢
信效度修订版信度
叙事安全教育材料的初步编制与信效度检验
《广东地区儿童中医体质辨识量表》的信度和效度研究
青少年网络素养问卷的修订及信效度检验
当代诗学研究的可喜收获——评李元洛《诗美学》修订版
长征(修订版)
《核材料实物保护公约》修订版正式生效
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
沉思反应问卷中文版在大学生中的信效度检验
中文版脑性瘫痪儿童生活质量问卷的信度