医学期刊论文统计方法中检验水准α的常见误用分析

2017-05-15 03:17徐咏军
合肥学院学报(综合版) 2017年2期
关键词:均数水准实例

徐咏军

(皖南医学院 学报编辑部,安徽 芜湖 241002)

医学期刊论文统计方法中检验水准α的常见误用分析

徐咏军

(皖南医学院 学报编辑部,安徽 芜湖 241002)

统计检验是医学科研的重要工具,医学论文的作者应根据分析数据的具体情况合理设置检验水准α。按照数据类型进行分类,分别从错误分析及正确处理方法两个方面阐述了医学期刊论文中检验水准α的误用及正确使用方法。

医学论文;检验水准α;错误分析;正确方法

统计检验是医学科研的重要工具,而检验水准α又是利用统计检验发现问题的必用指标。检验水准α(或检验水平α,显著性水平α),又称犯Ⅰ类错误的概率,即当原假设成立时拒绝原假设的概率。检验水准α一般取值为0.05或0.01,取0.05时的意义为在原假设成立的情况下,拒绝原假设的概率为0.05。在统计学上,将发生概率P≤0.05事件的称为小概率事件,并且可以认为小概率事件不可能发生。利用这一原理进行显著性检验,其主要目的是减少犯Ⅰ类错误的概率,发现具有可比性的组之间在本质上是否有差异。笔者对安徽省两种医学期刊中2013—2015年发表的文献进行分析后发现,医学研究论文对检验水准α普遍存在误用的情况。本文从中挑选具有代表性的实例阐述了主要的检验水准α误用情况并给出了合适的解决办法。

1 多组均数的比较

1.1 样本数据服从正态分布

在医学期刊论文中,多组均数比较中如果样本数据服从正态分布则进行方差分析。进行方差分析比较有差异后,需进一步探索比较组中究竟哪两组的总体均数有差异。有些文献在做了方差分析后使用q检验进行进一步比较,有些在两两比较时直接进行多次t检验或t’检验。

(1)实例1:研究者欲比较芝麻素对大鼠体肝脏SOD的影响,表1为该研究的部分数据。根据作者描述,芝麻素组与模型组SOD差异有统计学意义(P<0.05)。

表1 芝麻素、维生素E、芝麻素联用

aaP<0.01 vs. Control,bP<0.05,bbP<0.01 vs. model,ccP<0.01vs. seasmin

错误分析:研究者将五组数据进行方差分析后,使用了t检验进行两两之间均数的比较。但是将检验水准α设为0.05增大了犯Ⅰ类错误的概率,此时犯Ⅰ类错误的概率已经增加到0.401。因此,作者按照显著水平为0.05所下的结论是不准确的。

正确方法:此时,若要用t检验进行两两之间均数比较需要对检验水准α进行调整,调整方法为αa=α/比较次数(本例中αa=α/10=0.05/10=0.005)[1]。可见该研究若未对α进行矫正,根据检验水准α为0.05所下的阳性结论是不正确的。根据调整后的检验水准α,芝麻素组SOD与模型组差异没有统计学意义(P>0.05)。

(2)实例2:某研究比较不同组大鼠膈肌的P0指标是否不同。作者所下的结论为DM组P0与CON组相比降低了,GSH组P0与DM组比升高了,具体情况见表2。

表2 各组大鼠膈肌P0指标的比较(x±s,n=10)

与CON组比较bP<0.05;与DM组比较eP<0.05

错误分析:该三组之间两两比较需要比较三次,根据该研究所设的检验水准α为0.05,在没有进行检验水准α的校正情况下多次比较犯Ⅰ类错误的概率为P=1-(1-0.05)3≈0.143。所以此时作者根据检验水准α为0.05下结论是不准确的。

对于多组均数之间的两两比较,现在更倾向于使用特定的方法进行比较,常用的有q检验、Dunnett-t检验等,其中q检验常用于多个均数间的两两比较。[2]

1.2 样本数据服从偏态分布

一些定量变量并不服从正态分布,所以需要使用秩和检验进行多组比较。然而在进行两两比较时,如果继续按照α=0.05的检验水准α进行多次秩和检验,则同进行多次t检验一样,增加了犯Ⅰ类错误的概率。

(1)实例3:研究者对各组UC大鼠的结肠CMDI评分进行比较,见表3。

与UC对照组比较bP<0.05,cP<0.01;与UC应激组比较eP<0.05,fP<0.01。

错误分析:按照研究设定的检验水准α为0.05,多次比较后犯Ⅰ类错误的概率为P=1-(1-0.05)6=0.265,远大于0.05。多次比较后增加了犯Ⅰ类错误的概率,导致了结论的不准确。

正确方法:针对偏态或者等级资料,两两比较常用的方法为推广的t检验。[3]

(2)实例4:某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例,见表4。

表3 各组UC大鼠结肠CMDI评分的比较

表4 3种方法治疗胰腺癌患者的生存月数比较

错误分析:如果进行多次秩和检验,则会增加犯Ⅰ类错误概率。

表5 秩和检验两两比较,甲组与乙组比较为例

2 多组率的比较

多组率比较常用χ2检验。在进行两两比较时,如果不校正则会增大犯Ⅰ类错误的概率,原理同方差分析中用t检验做两两比较时相同。在率的比较中,并没有特定的方法进行两两比较,而只有进行检验水准α的校正,详见实例。

(1)实例5:研究者探索不同用药组(分为A组、B组和C组)恶心呕吐情况,数据见表6。在该研究中作者下结论为,A组B组患者恶心呕吐发生率与C组比较显著降低,差异具有统计学意义(P<0.01或0.05)。

表6 三组患者恶心呕吐发生率比较(n = 40)

与C组比较bP<0.05,cP<0.01

(2)实例6:某研究欲比较Wnt2的免疫组效果,比较了五个组的阳性率,见表7。作者的结论为各组与对照组相比,差异有统计学意义(P<0.05)。

表7 Wnt2在大肠癌和正常肠黏膜的表达

与对照组比较bP<0.05

错误分析:本次共有5组需要比较,比较次数为5次按照作者设置的检验水准,多次比较后,犯Ⅰ类错误的概率上升到P=1-(1-0.05)10=0.401。所以作者按照检验水准α为0.05下结论是不准确的。

3 讨 论

在医学期刊论文中很多文献都存在各种各样的统计学误用,但是总结检验水准α误用情况的文献很少。本文总结了检验水准α的误用情况并给出了正确的使用方法。对于多组均数和多组率之间的两两比较,都可以对检验水准α进行调整,但是均数的两两比较一般不推荐使用t检验或t’检验。[6]在进行多组均数两两比较时推荐使用q检验或其他特定的检验方法。而针对秩和检验后两两比较的方法较多,每种方法都各有利弊,研究者可以根据研究需要选择合适的检验方法。[7]

作者误用的原因大致可以分为以下两点。第一,对于检验水准α设为0.05的原理不清楚,盲目的认为所有的检验水准都是0.05。检验水准α为0.05是最常用的,但并非是所有的检验水准都可以定为0.05。研究者应根据需要结合现实意义和统计学原理,选择适当的检验水准。第二,研究者混淆了各种统计学检验方法所适用的条件,错误使用了统计学方法,也会导致检验水准的误用。检验水准α的误用,归根到底是对统计学知识的理解不透彻,在使用统计学方法时没有慎重考虑。检验水准α的误用,有可能导致差异本来没有统计学意义的变成了有意义,即假阳性结论的产生。

本文通过方差分析、秩和检验和χ2检验三个方面讨论了多组参数进行两两比较时的检验水准α误用问题。检验水准α的设定是进行统计学检验的重要环节,但并非是所有的检验水准α都可以设为0.05。[8]医学科研工作者应根据要分析数据的具体情况合理设置检验水准α,医学期刊的编辑也应加强对医学论文中检验水准α设置的审校。

[1] 李雪迎. 多重比较与检验水准的调整[J]. 中国介入心脏病学杂志, 2013,21(2):96.

[2] 方积乾. 卫生统计学[M]. 7版. 北京:人民卫生出版社,2013:138- 139.

[3] 黄水平,丛宁.多个计量样本间非参数两两比较方法的选择[J].中国卫生统计, 2000,17(4):243- 244.

[4] 方积乾. 卫生统计学[M]. 6版. 北京:人民卫生出版社,2008:45.

[5] 黄水平. 多个样本率间的两两比较方法[J]. 徐州医学院学报, 2002,22(4):291- 294.

[6] 姚应水. 医学科研论文中χ2检验误用分析[J]. 皖南医学院学报, 2005,24(1):78- 80.

[7] 刘万里. 计量资料多重比较方法评价[M]//薛茜, 尔西丁. 流行病学与卫生统计学,2007:1- 70.

[8] 曾平. 统计学里如何选择检验水准(何时选择P<0.01或选择P<0.05为差异有统计学意义)[J]. 中国心血管杂志, 2011,16(1):25.

[责任编辑:张永军]

Discuss on the Misuse of Test Levelαof Statistical Testing in Medical Paper

XU Yong- jun

(Editorial Department of Journal,Wannan Medical College,Wuhu 241002,Anhui,China)

Statistical testing is an important tool for medical research, the author of medical paper should set up the test levelαaccording to the type of data. This paper discuss the misuse of test levelαin medical paper and propose the correct method of use according to the classification of data type.

medical paper;test level α; analysis of misuse; correct method of use

2016-10-15

2017-02-21

皖南医学院中青年科研基金项目(WKS201004)资助。

徐咏军(1969— ),男,上海人,皖南医学院学报编辑部编辑。

R 195

A

2096-2371(2017)02-0037-04

猜你喜欢
均数水准实例
一种改进的水准网条件平差算法
媲美激光光源的成像水准Acer宏碁E8620C
关于均数与偏差
完形填空Ⅱ
完形填空Ⅰ
关于均数与偏差