横断面研究护理论文评价要点解读(二)

2019-02-19 20:11刘晓华周倩成守珍
现代临床护理 2019年7期
关键词:样本量条目量表

刘晓华,周倩,成守珍

(中山大学附属第一医院1 现代临床护理编辑部,2 临床研究中心,3 护理部,广东广州,510080)

“横断面研究的护理论文评价要点”共有32 个评价条目和76 条细化的评价内容,详见《现代临床护理》杂志2019年第5 期[1]。前期(见2019年《现代临床护理》第6 期)[22]已对评价要点第1~12个条目(即从题目至前言)分别进行解读,本期拟将对13~23 个条目: 资料与方法中的10 个条目,即研究设计、研究实施、研究对象、抽样方法、样本量、伦理、研究变量、变量测量与测量工具、资料收集的质量控制、偏倚、统计学方法分别进行解读,解读内容包括每个条目的定义、评价内容、具体描述内容建议及值得注意的问题等。由于本期是上一期未完待续的解读内容,因此本文解读内容的序号与标题、文后参考文献与序号按上一期顺延[22]。需要特别说明的是,本文部分文后参考文献与上一期是相同的,因此需要查阅文后参考文献的读者可查阅上一期。

1.7 资料与方法

是研究论文方法论部分的主要内容,是判断论文严谨性、科学性、先进性的主要依据。

条目13(研究设计)。

研究设计是指一项研究的体系结构[23],在研究方案中需要明确阐述它的结构、 研究人群具体的细节信息、 时间范围和流程、 伦理学审核等问题。研究设计可使抽象的研究目的具体化,形成研究方案,指导研究者有计划地收集资料、归纳和分析资料,最后完成研究目的。

评价内容:①是否描述研究设计类型(如横断面研究,现况研究);②研究前是否进行了预试验,预试验为正式研究提供了哪些支撑。

具体描述内容,建议“研究设计”:①需要在前言后半部分或方法前半部分写明研究设计类型。②一般在大规模或大样本的研究前需要进行小规模的预试验,以熟悉和摸清研究条件,检查研究设计是否切实可行,有无需要改进的地方,并估计样本量、预判正式研究实施的必要性、甚至预测正式研究成功的可能性。

条目14(研究实施)。

评价内容:是否描述数据收集的地点和时间范围。

具体描述内容,建议“研究实施”:研究地点需注明研究对象来源地点(如某三级医疗机构、某社区等);时间范围包括目标人群的招募、研究的抽样、研究对象的入组,暴露和结局数据收集的起止时间等。因为治疗方案和环境等暴露因素均会随时间变化,研究方法本身也会随时间更新,因此应详细报告研究开展的地点与时间。

条目15(研究对象)。

通常指从总体中抽取的样本,是指研究中具有某种特征(如年龄、文化程度)、某种性质(如某医院的患者,具有某种暴露特征的人群)的全体。其中暴露是指研究对象接触过某种待研究的物质(如噪声),具备某种待研究的特征(如种族类别)或行为(如吸烟)[24]。

评价内容:是否明确纳入标准和排除标准。

具体描述内容,建议“研究对象”:需要依据研究对象的特征(人口学特征及人群特征等),制定研究对象的纳入标准与排除标准,确保研究人群的同质性。

值得注意的问题: 排除标准是纳入标准的补充,而非相反方面或对立面[25]。加拿大麦克马斯特大学的GUYATT 教授等[26]对纳入标准与排除标准的定义为:是指决定候选人是否可以进入研究的医疗或社会标准,一般应基于年龄、性别、疾病的类型和分期、既往史和其他一些与诊断、危害、病因、预后、治疗等相关的情况制定。需要说明的是,纳入标准与排除标准并不是用来拒绝候选人的,而是为了筛选出合适的参与者并保证他们在研究过程中的安全与获益。简而言之,合格标准就是针对相应的研究主题,在符合伦理道德及实际情况下所指定的一种进入到研究的研究对象应具备的条件。

条目16:抽样方法。

随机抽样的样本获得需遵循随机化原则,即保证总体中每一个对象都有已知的、 非零的概率被选为研究对象,以保证样本的代表性[27]。

评价内容:抽样的方法及抽样标准是否明确。

具体描述内容,建议“抽样方法”:说明具体的抽样方法:非随机抽样、随机抽样,前者如典型调查,便利抽样 (所抽取到的样本可能发生选择偏倚,影响研究结果的外推[1],应尽量采用概率抽样法,以降低偏倚的发生),后者如单纯随机抽样、分层抽样等; 确保研究对象采用同样的标准被选为样本,而不是任意变换抽样方法,例如原本按患者门诊号来随机选择(抽样),之后又改用住院号等其他方法来抽样。

条目17(样本量)。

是研究者在保证研究结论可靠性的前提下,确定该研究中所需要的最低研究单位的数量。

评价内容:是否描述样本量估算的依据。

具体描述内容,建议“样本量”:需要规范报告样本量的计算流程,如采用哪种调查方式(概率抽样方式还是非概率抽样方式),若是概率抽样方式,具体采用何种抽样方式(单纯随机抽样,系统抽样等); 同时应考虑影响样本量大小的因素,如预期现患率(预期均值)或结局变量总体标准差、容许误差、 置信水平的取值。当样本量估算完成后,应考虑一定比例的脱落率(如10%)。注意应避免事后给出样本量大小。

值得注意的问题: ①如事先无法计算样本量,应说明原因,并考虑对应的置信度分析,明确已有样本量能否得到具有足够统计学精度的结果。②对于多重线性回归分析变量的估算,有一种经验性的建议样本数n 一般是所研究自变量m 的10~20 倍,但一定要求在复相关系数大于0.5 时尚可,而对较少的复相关系数则仍然偏小[28]。建议可参照HSICH 提出的回归系数假设检验样本量推广到多重线性回归问题中的样本估算方法[29]。二元Logistic 回归样本的估算采用极大似然比法估计。目前,广泛使用的方法是每个变量的事件数作为标准(events per variable,EPV)的方法,即每个自变量的事件数,其中事件表示因变量中个数较少的那一类[30],推荐的经验准则是EPV 至少为10(才能保证结果稳健),以确定所需的最小样本量和可以纳入的自变量的最大数量。例如,某研究有200例患者,其中因变量(如抑郁:0=不抑郁,1=抑郁)中事件数为80,即抑郁人数为80,则回归方程可以纳入的自变量个数不能超过8 个(即80÷10);反过来,如果研究的自变量有8 个,抑郁的发生率为40%,则样本量不能少于200例 (即8×10 ÷40%)。另外,一个比较常用的经验准则是样本量为协变量个数的10~15 倍[29]。具体应用时可以综合考虑两种经验准则。1998年,HSIEH[31]提出了样本估算公式,具体公式可参考方积乾教授主编的卫生统计学(第7 版)[29]。EPV 通常被认为是Logistic回归模型中参数估计效果的主要决定因素,在估算样本量时往往被格外重视。张晋昕等[32]学者认为,建议在采用经验法计算Logistic 回归样本量时,应同时兼顾所有自变量不同暴露水平下结局为阳性者、阴性者的人数都足够多。

条目18(伦理)。

当以人作为研究对象时,为了最大限度地保证被研究者的权益,要求研究者在研究过程中严格遵守伦理学原则。

评价内容:①是否有伦理学审核;②是否通过伦理审查、患者是否知情同意参与研究。

具体描述内容,建议“伦理”:①需要说明研究之前是否进行伦理学审核,其是确保患者研究过程安全及顺利开展研究的前提。②说明伦理审查情况及研究对象是否知情同意参与本研究,让患者知晓参与研究的益处及风险等,并注意研究对象的隐私与保护。值得注意的是知情同意不属于纳入标准,在一些已发表论文中往往将其表述在纳入标准中,这是不规范的做法。

值得注意的问题: 在报告有关人类的研究时,应指出此研究是否符合人类实验委员会(机构或区域)的道德标准以及2000年修订的1975年赫尔辛基宣言(可在http://www.wma.net/e/policy/17-c_e.html 上查阅)。对于涉及人类受试者的前瞻性研究,作者应提及已通过区域/国家/机构或独立伦理委员会或审查委员会的批准,并获得成人研究参与者的知情同意。根据区域和/或国家指导方针,需要批准的年龄可能有所不同。避免提及参与者的姓名、姓名首字母或医院编号,确保受试者的保密性。建议作者投稿时根据要求提供当地伦理委员会批准的证明材料。

条目19(研究变量)。

研究变量是指在研究过程可以测量、操纵或控制的具有不同抽象程度的概念。具体概念变量,如年龄、性别、体温等;抽象概念变量,如生活质量、社会支持等。研究时应明确主要的研究变量,一般可通过文献查阅并结合研究目的来确定研究变量及其定义,然后进一步确认其可能的测量指标;最后是根据研究设计类型把研究变量进行分类,这样更加明确变量间的相互关系和作用。研究变量可分为自变量、因变量、混杂变量、人口学变量等。自变量指能够影响研究目的的主要因素,自变量不受结果影响,却可以影响结果或导致结果的产生。因变量指想要观察的结果或反应,它随自变量改变而改变,也可受其他因素的影响[33]。还有一些干扰研究结果的因素,称为混杂变量,应在统计分析中进行校正。人口学变量指研究对象具有的某种特征,如年龄、文化程度、职业或某种特定疾病等。

评价内容:①是否明确了所有测评指标,包括自变量、因变量、混杂变量、人口学变量等;②是否明确所有测评指标的操作性定义和或诊断标准;③是否列出变量赋值清单。

具体描述内容,建议“研究变量”:①应明确研究中哪些是人口学变量,哪些是研究主要变量(如因变量和自变量),哪些是研究中的混杂变量,并确定其测量的指标。②需要对全部研究变量制定明确操作性定义(具体内容见条目20 变量测量及测量工具的解读)和或诊断标准。③若分析涉及多个变量,要求需提供一个详细的变量赋值清单,介绍各变量(即候选变量)的详细情况,而不能选择性地只报告最终纳入模型的变量 (此部分内容可置于结果中进行描述)。

值得注意的问题:国外期刊要求应完整地描述变量的选择过程、定义及依据,中文论文在这方面描述较简略,可能只介绍其来源,如通过文献回顾、预调查、前期访谈等自行设计人口学变量等,较少提及变量选择过程及依据。希望作者能清楚描述选择研究变量的依据,特别是研究中影响模型的自变量,以便让读者了解研究的背景及明确各变量是否与该研究相关。

条目20(变量测量及测量工具)。

变量的测量指通过各种测量、问卷、访谈、观察等方式从研究对象处直接收集原始资料[2]。变量的测量首先需明确其测量的指标,然后确定其测量的工具,最后是确定资料收集的方法。

资料收集一般包括生物医学测量法 (通过仪器、设备等测量工具获取的资料,比如血压、体温、红细胞),观察法(指研究者通过肉眼直接对事物或事件进行观察,获得的一手资料的方法,如通过压疮评估表评估患者压疮发生的风险情况),问卷法和访谈法 (通过问卷填写或与研究对象沟通来获取资料,如采用社会支持量表评价血液透析患者社会支持状况,又如获悉患者的家族史)。要求所选择的研究工具应具有信度、效度、敏感度,能够准确测量研究指标。

对于抽象概念(例如衰弱、社会支持等)变量通常采用量表或问卷进行测量,因此研究前需要明确其理论定义及操作性定义,并转化为可测量的工具。理论定义指对研究变量本质的概括,以揭示其内涵,并将其与其他变量区别开来。操作性定义指用可感知,度量的事物、事件、现象和方法对变量或指标做出具体的界定[2]。例如衰弱的理论定义: 衰弱是指老年人生理储备下降或多种功能异常致使机体易损性增加、 抗应激能力减退的非特异性状态,其发生发展是一个动态的过程[34]。操作性定义:为2010年由GOBBENS 等[35]基于衰弱整合模式开发用于老年人衰弱状况评估的自评量表评分。测量指标:为量表中3 个维度(躯体衰弱、心理衰弱、社会衰弱)中15 个测评条目。

操作性定义是“概念”与“现实”的中介与桥梁,从测量变量到研究工具,本质就是将操作性定义转化为研究测量工具的过程。如何将操作定义转化为测量工具,通常有两种方式:当没有现成研究工具测量抽象概念变量时,需要研究者根据操作性定义去设计测量工具或量表,例如营养不良,包括6 个方面,每个方面下面有一些条目,如近3个月体重是否有丢失、BMI 变化情况、 是否患急性疾病、活动能力状况、是否患有精神心理问题、是否患有消化系统疾病等条目。当有可选用现成的量表或问卷时,研究者可根据操作性定义选择该量表或问卷。需要特别注意的是:量表原创者对该量表的理论定义是什么,只有当量表原创者与研究者对该变量的理论定义尽可能一致时,研究者才能选用该量表。例如论文《老年糖尿病患者衰弱现状及影响因素研究》 中测量老年糖尿病患者衰弱情况[5],研究者必须深入了解量表原创者GOBBENS 等[35]对衰弱是如何定义的,研究者才能选用GOBBENS 等的衰弱量表作为测评工具。

评价内容: ①是否明确研究指标的测量方法(如观察法、问卷法);②是否采用合适的测评工具测量研究变量; ③是否清楚描述引用的量表名称和设计者、 应用的范围、 内容 (包括维度或条目数)、计分或评价方式、得分及其意义等,并说明其信度与效度; ④是否清楚描述引用自行设计调查问卷的名称及设计目的或依据,必要时说明其信度与效度;⑤变量如为定量测量资料时,如需分组(段)描述其特征,是否清楚提供其依据。

具体描述内容,建议“变量测量及测量工具”:①需要明确所有研究变量的测量指标类型,包括自变量、因变量、人口学变量及可能混杂变量等,详尽说明各研究变量指标的测量方法 (如是观察法,面对面问卷调查,还是问卷星调查等),因为上述指标对应的测量方法会直接影响研究结果的信度和效度,尤其是对自变量(暴露)和(或)因变量(结局)的测量误差和错分偏倚经常会导致假阳性或假阴性结果。②需要明确研究变量的特点,采用具体合适的测量工具,准确测量变量的现况和变化。③对于采用现成的量表进行关键指标测量时,应明确量表名称和设计者,测评工具的类型,测评工具测量的应用范围,所包含的维度及条目、计分方式或评价方式,并应报告其信度与效度,以便读者借此校正或评价测量误差的影响。④对于引用或自行设计的调查问卷应说明其是如何根据操作性定义去设计相应的测量指标,并应报告其具体评价的内容,必要时报告其信度与效度。⑤变量如为定量测量资料时,如需分组(段)描述其特征,应提供其依据,例如《老年糖尿病患者衰弱现状及影响因素研究》[5]中采用老年糖尿病患者的Tilburg 衰弱量表(Tilburg frailty indicator,TFI)[35]测量衰弱情况,量表总得分范围为0~15 分,总分5 分及以上为衰弱,研究就是以此(5 分)为依据进行暴露(是否衰弱)的分组。

条目21(资料收集的质量控制)。

指在研究过程中为保证资料收集的质量及研究的精度,在研究前制定保证准确收集资料的控制方法。

评价内容: ①是否清楚描述资料的收集过程;②如果是两个及以上的调查者是否进行统一培训; ③资料收集过程在整个研究过程中是否保持一致。

具体描述内容,建议“资料收集的质量控制”:①应详细描述资料收集过程,如应明确由谁进行资料收集、收集哪些资料、当研究对象不能配合调查时采取何种措施、是否当场回收问卷等。②如需多人进行资料收集时,需要对调查者进行统一培训,使资料收集的流程和对患者解释说明的内容标准化,调查过程有督导员对问卷质量进行把关。③需要报告资料收集过程采用哪些措施 (例如在调查结束时,随机抽取一定样本量的调查表进行重复调查,比较两次调查资料的一致性来评价调查的质量,或在调查过程中,对调查表若干问题进行重复调查等,抽查比例一般为5%~10%),保证调查者资料收集过程始终一致,其是保证结果真实、可靠的有效办法。

条目22(偏倚)。

偏倚一般包括选择偏倚,信息偏倚,混杂偏倚[27]。若研究存在偏倚,会导致研究结果系统性偏离真实值。本条目主要介绍信息偏倚(测量偏倚、调查偏倚、无应答偏倚、报告偏倚等)的来源及处理方法,选择偏倚见条目16(抽样方法),混杂偏倚见条目27(主要结果)的介绍。

评价内容: ①是否对可能的潜在偏倚进行描述,如选择偏倚,信息偏倚,混杂偏倚等;②是否描述控制偏倚的方法。

具体描述内容,建议“偏倚”:①应评估各种信息偏倚的可能性,分析讨论估计偏倚的方向和大小。②若研究中采用了某些方法减少偏倚,应提供具体细节,如调查前是否组织研究工作,调查员是否经过培训,统一标准和认识,避免测量偏倚;选择资料收集者时,是否实施调查者盲法来降低信息偏倚,盲法是为了规避研究者心理因素的影响,如有意对某感兴趣的变量过多地关注,而对不感兴趣的变量不重视或马虎调查造成的资料收集偏倚;资料收集过程,如有两个及以上的收集人员收集资料,资料收集过程是否保持一致,是否进行调查者测量一致性检测等来避免调查偏倚; 如何采用灵活的资料收集方式和技巧来提高研究对象的依从性和受检率,降低无应答偏倚或报告偏倚;如何选择合适的准确的测量工具和检测方法来降低测量偏倚等。

条目23(统计学方法)。

统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。

评价内容:①统计描述是否正确;②统计学方法是否适合收集的资料;③是否明确了检验水准;④是否说明缺失值处理方法; ⑤是否描述统计学分析的软件与版本。

具体描述内容,建议“统计学方法”:①需要描述各变量数据类型,如计量变量常用均数和标准差(正态分布),中位数和四分位数(偏态分布)进行统计描述,计数资料采用频率、构成比进行统计描述,等级资料采用频数、构成比进行统计描述。②详细描述研究中所涉及的全部统计方法 (包括控制混杂的方法),如正态分布的计量资料采用t检验或方差分析;计数资料采用χ2检验,等级资料和偏态分布的计量资料采用秩和检验,两变量相关性分析采用Pearson 相关分析,回归分析用于探讨一个或多个影响变量对一个结局变量的影响,视结局变量的形式不同可考虑选用多重线性回归或Logistic 回归。当因变量的计量资料(同时满足方差齐性、独立性、正态性的)时采用多元线性回归,当因变量为二分类变量时,采用Logistic 回归。同时应报告多因素变量分析采用何种方法,是进入法还是逐步法 (逐步法应报告筛选F 检验界值a,一般取值a=0.1)。③应给出检验水准(a=0.05 或a=0.01)和单双侧检验。④需要报告数据的缺失情况及处理措施,以了解数据缺失对结果的影响,国内大部分论文在这方面较少报告,希望以后能引起作者注意。需要作者详细报告以下内容[36]:报告各个变量在各个分析环节的缺失数量和比例,并分析讨论缺失的原因; 提供因数据缺失导致未纳入分析的研究对象数量,介绍采用处理缺失数据的统计方法(如直接剔除、填补测算等)。例如依据缺失比例,在5%以内,连续变量可以用中位数或者均数填补的办法;如缺失比例小于20~30%,可以用多重填补法。⑤提供统计学分析软件与版本。

值得注意的问题:①在多重线性回归分析还应报告共线性问题,因为共线性的存在,无法真实判断共线性所涉及变量对因变量的预测能力。②注意对于非常规通用的方法,尤其新的方法,应报告所使用的统计软件并标注对应的参考文献。③如果进行亚组分析,应提供依据,以方便读者细致了解分析方案。如某疾病男女发病率悬殊,而且影响因素有所不同,这时候可以进行亚组分析,了解其各自的发病情况及影响因素。④需要将研究中所涉及敏感性分析的目的及策略进行介绍,其常用于比较当使用替代分析策略或基于其他假定情况时,研究的主要结果是否保持一致。主要用于缺失值的处理、不准确或不一致的测量导致的偏倚等。例如贾文文等[5]报道的老年糖尿病患者衰弱现状及影响因素研究中,其纳入调查的人数300例,回收有效问卷296例,但其中若有20 个条目缺失(设定问卷有一个条目缺失,则记为问卷缺失),即缺失率为6.76%(20/296),那么如果作者采用了缺失值填补方法对数据进行了填补,仍保留296 份问卷进行分析,则应对276 份完整问卷进行敏感性分析,了解其缺失率对总体的影响。

(本解读内容未完待续)

猜你喜欢
样本量条目量表
医学研究中样本量的选择
网络服装虚拟体验的概念模型及其量表开发
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
胸痹气虚证疗效评价量表探讨
《词诠》互见条目述略
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
三种抑郁量表应用于精神分裂症后抑郁的分析
慢性葡萄膜炎患者生存质量量表的验证
样本量估计及其在nQuery和SAS软件上的实现——均数比较(二)
自适应样本量调整中Fisher合并P值法和传统检验法的模拟比较