主观评分数据的稳健化处理初探

2007-11-08 10:45彭大松左从现
吉林体育学院学报 2007年2期
关键词:稳健性裁判员主观

彭大松 左从现

(南京晓庄学院体育系,江苏 南京 210017)

主观评分数据的稳健化处理初探

彭大松 左从现

(南京晓庄学院体育系,江苏 南京 210017)

统计应用领域中,统计量的稳健性的重要性在于数据有少量异常值情况下,仍能使统计处理保持较好的稳定性。体育科研中数据的收集过程受多因素影响致使所收集的数据常常混杂异常值,从而影响了统计结果准确性,甚至会误导分析者。通过对竞技体育中的主观评分数据现行处理办法的稳健性进行分析,指出该处理过程稳健性差的原因在于统计量本身缺乏稳健性,并从变换的角度提出了非参数变换办法增强统计处理过程稳健性,实证研究表明,对主观评分数据的实施非参数稳健化变换在保证结果有效性的同时具有可行性与可操作性。

主观评分;稳健化;竞技体育

1 引言

竞技体育中,有许多项目是通过裁判员主观评定给出分数来决定比赛名次的项目,如跳水、体操、武术、花样游泳等。为提高主观评分的有效性,许多学者致力于规则的修改、评分标准的细化、裁判员素质的提高等方面的研究并取得了长足的进步。然而,对主观评分数据最后得分的统计处理仍然不够理想。

主观评分是人的意识参与的过程,不可避免存在误差,而误差将会给比赛结果带来决定性影响。围绕降低误差影响而进行的研究提出了许多办法,其中较有影响的方法是对裁判员评分数据采用“对称截尾”(即去掉最低、最高分)的办法降低人为因素误差。尽管“对称截尾”的办法在一定程度上降低了人为因素误差的影响,但同时给统计处理过程带来了信息损失的不足。为此,有些主观评分项目如武术、体操等采用了“主裁修正”的办法,虽然它避免了裁判员平分的信息损失,但它也不能从根本上提高统计处理的稳健性,从目前实施效果来看,也不尽如人意。

本文以第34届世界体操锦标赛的部分评分数据为例,分析了竞技体育主观评分数据最后得分统计处理存在的不足,并从提高统计稳健性的角度提出了用非参数变换的办法对最后得分进行稳健化处理,研究结果表明该办法在保证有效性的同时具有可操作性,为恰当地处理主观评分数据提供了重要的参考和理论依据。

2 统计稳健性与主观评分数据

2.1稳健性的内涵

统计应用中,追求统计量的稳健性等同于追求统计方法或统计模型在外界干扰下的稳定性。如同大多数时候,我们假定数据服从正态分布一样,但实际应用中很少有确切服从正态分布情形,因此我们希望统计量或统计方法具有这样的性质:当数据或是模型有微小变化时(如微小偏离正态),统计方法的性能也只受到微小的影响。否则,针对数据为正态所构造的统计方法在理论上具有良好的性能,但到了实际应用中会因为各种因素的干扰而使得统计方法丧失其优良的性能。我们把统计方法对模型或数据的微小变化反应不敏感的性质称为统计稳健性。

从广义上看,统计稳健性还有另一层含义:即在实施任何一统计方法时通过观察或试验取得样本观测值x1,x2,…,xn的过程中,由于种种原因使得整个数据中,有一个或几个含有较大的误差的数据。这些数据游离于主体数据之外,远离了数据中心。这时,我们希望统计量具有这样的性质:即它受到这些异常数据的影响不大。

2.2主观评分方法的演进与稳健性分析

所谓主观评分数据是指裁判员根据比赛规则和评分细则,对运动员或表演者的动作予以打分,这些分数即是主观评分数据。通过分数的高低显示选手水平的高低从而决定比赛名次的。

对于主观评分决定比赛胜负一直以来存在极大的争议,主要是两个方面的:其一,评分细则量化程度,裁判员水平,裁判员人数多少等专业方面的因素导致了主观评分误差过大,从而使其公平、公正性受到质疑。其二,最后得分的处理环节不当导致了最终名次不合理所受到的质疑,这是属于统计处理上的问题。

许多学者一直致力于两方面的研究,其成果是毋庸置疑的。在第一个方面研究中,提出了最佳裁判员人数,评分规则进一步量化和修改,加强裁判员水平培训等等。这些方法都在一定程度上使得主观评分问题更加规范与客观。在第二个方面的研究中,由最先的“对称截尾”(去掉最高、最低分的办法)处理最后得分,到现在的“主裁修正”(主裁判打分修正最高最低分)的评分方法。从统计处理方面加强了主观评分的公正性。但到目前为止,在最后得分的统计处理上,效果还不甚令人满意。

首先,为了确保主观评分处理的稳健性而采用对称截尾办法,其缺点是显而易见的:剔除高分、低分值使得所测得的数据信息不全。不排除少数裁判员因某些厉害关系而给出不公正评分,但大多数裁判员给出的评分都是客观的,具体地说,就是它代表着对该队员动作的一种评价。我们没有理由认为这位打高分或低分的裁判员的观点是错误的。对评价中的高分值或低分值,不加思考一律予以剔除的做法是一种不负责任的行为,更是对裁判员裁判权力的一种剥夺。长此以往,裁判员为了维护自己的权利,都不敢客观公正给出个人的评价,都一味地给出中间分数,形成一种恶性循环。正如魏登云教授对第34届世界体操锦标赛的女子自由操比赛的评分分析中所指出的“694号运动员和253号运动员最后的得分都是9.737,如果保留全部6位裁判员的评分的(不去掉最高最低得分),结果应该是253号运动员将优于694号运动员,正是由于去掉了最高最低得分,才导致两名运动员最后排名并列。”从信息论的角度看,去掉了数据导致了信息损失,损失了两名裁判员的评分信息,要想使结果仍然公正公平,是很难办到的。特别是竞技体育高度发展的今天,在国际比赛中,各国选手比拼日趋激烈,比分相差很小。在这种情况下,只要评分数据有微小的损失,导致的将会是完全不同的结果。

其次,主裁修正办法虽然保证了信息的完全性,在一定程度上弥补了对称截尾办法的不足,但主裁的修正是否恰当、是否合理仍然有很大的争议。

3 主观评分数据的非参数稳健化处理

考虑到非参数天然就具有比参数统计方法更高的稳健性,因此,考虑用非参数处理办法改善最后得分环节的稳健性,即非参数秩分评定法。

3.1秩分评分法原理

秩分评分分三个部分组成,即符号秩分、比例秩分、综合秩分。

2)比例秩分就是将最后得分转化为秩分。计分方法是:将最后得分从低到高的顺序排列,按所在位置计分,最低计1分,如果有相同最后得分则以其所处位置的平均值作几个相同数的秩分。

3)最后把符号秩分和比例秩分的信息合并到一起,综合起来评定运动员最后得分,这一步称为综合秩分。合并时,应该作加权平均处理,因为主体是符号秩分,而比例秩分只是对符号秩分遗漏的信息进行补充,所以,建议符号秩分的权重应在0.6以上,比例秩分占0.4以下。

3.2秩分评分稳健性分析

符号秩分是保留了所有裁判员的打分信息,把具体得分在量上进行模糊化处理,只比较分值之间的大小,而把具体的大多少、小多少的信息忽略掉,在一定程度上提高了数据的抗干扰能力,增强了处理过程的稳健性。具体地说就是,如果6位打分裁判中,有一裁判员打的分值是人为异常值,那么该裁判员的分值,至多影响秩分中的一个符号而已,而不至于把其差值的影响也带进去。这就无形中降低该异常点的影响,有效地提高了方法抵抗异常数据的干扰能力。与原来的计分办法相比较,该方法有两个优点:其一,保留了所有裁判员的打分,使打分信息无损失,同时也尊重了每位裁判员的评分权力。其二,原方法中在“对称截尾”之后实施算术平均的作法,表面上看是使每个裁判员打分做等权处理,其实不然。我们可以设想:假如“对称截尾”处理后,数据中还有一个评分数据是人为异常值,那么,该值实际也是远离数据中心(均值)的,它同中心数据(均值)差值就大,即使是等权的情况下,它的影响要比靠近数据中心的要大的多。所以,原方法表面上是等权处理,其实是夸大了远离数据中心数据的影响。而符号秩分法有效地避开了原方法这个弱点。只考虑运动员分值两两比较所得的正负号数目,弱化了异常数据与中心数据差值大小对整体的影响。提高了符号秩分方法的抗干扰能力,增加了其稳健性。当然符号秩分也并非完美的。它在应用中容易使个体之间出现相同的符号秩分现象。另外,符号秩分略去评分上量的差别,显得比较粗糙,区分度不够高。为改进符号秩分的不足,提出了比例秩分。

比例秩分正是对符号秩分不足的一个补充,首先,比例秩分将最后得分进行秩分化,正是考虑最后得分在量上的差异,弥补了符号秩分在处理过程中所忽略的量的信息。另外,对最后得分秩分化相当于对符号秩分的一个修正,给出了一个合理的附加信息,避免了因相同符号秩分过多带来的麻烦。所以,这种既考虑到了裁判员在打分的量上的差异同时,又能减弱异常数据对方法带来的影响的作法是非常合理的。

为了证实该评分办法的可行性,下面采用符号秩分赋权0.6,比例秩分赋权0.4的办法对第34届世界体操锦标赛女子自由操决赛名次进行重新评定。下面的数据取自第34届世界体操锦标赛的部分运动员的评分数据,运用秩分方法对之进行重新评定。表1数据来自女子平衡木的决赛数据。

表1 女子平衡木原始评分数据一览表

按符号秩分记分办法重新计算,结果如表2所示。

表2 女子平衡木决赛符号秩分以及符号秩分名次一览表

表2中出现了252号运动员与675号运动员符号秩分相同的情况,为此比例秩分给出了进一步的修正,并按照符号秩分与比例秩分分别为0.6和0.4计算综合得分,其结果见表3。

>表3女子平衡木决赛比例秩分、综合秩分及最后名次一览表

运动员2529633347747736712536757.53164527.5831645277.73164527.316835472

比较表1与表3的结果可以看出评定的结果高度一致,同时也有效地避免了253号运动员同694号运动员最后得分相等现象。由此可以看出,秩分法评定最后名次,在增加了方法的稳健性的同时又不失方法的精确性。在实践当中操作也并不复杂,值得在竞技体育中推广应用。

4 小结

主观评分数据误差对比赛结果有决定性影响,发展稳健性统计方法处理主观评分数据最后得分是亟待解决的问题。本文所提出的非参数稳健化处理,是从统计稳健性角度提出来的。应用中需要注意的是:基于实际问题发展起来的稳健化方法效果的好坏,是依赖于方法如何更广、更深层次地挖掘样本数据中信息能力。样本是进行推断的依据,统计方法的优劣,很大程度上取决于它是否充分地提出和使用样本的信息。例如,上面讨论的秩分方法就是不断地补充遗漏的样本信息过程,符号秩分忽略了评分信息中的量的信息,比例秩分就是对此进行补充,达到最大限度利用样本信息,使非参数方法更精确。

非参数秩分评定方法是基于稳健性角度考虑的,它的长处是弥补了原有评分方法的不足,但非参数方法也并非完美无缺的,如本文综合秩分中的权重的确定就应该依不同的比赛,不同的水平而有所不同,不能千篇一律。科学的确定权重值还依赖大样本数据为基础,这些都有待于进一步研究和改进。惟有如此,才能真正实现主观评分客观化、科学化,才能真正使得竞技比赛中的主观评分更加公正、公平。

[1] 魏登云.主观评分误差的非参数方法[J].中国体育科技,2001,(3).

[2] 陈希孺.非参数统计[M].上海:华东师范大学出版社,1989.

[3] 陈忠链.稳健统计[J].数理统计与管理,1986,(11):1-4.

[4] 成平,陈希孺,等.参数估计[M].上海:上海科学技术出版社,1985.

[5] 体育统计教材编写组.体育统计学[Z].北京:人民体育出版社,1991.

TheResearchofRobustnessInSubjectiveGradingData

Peng Dasong,Zuo Congxian

(The P.E Department of Nanjing Xiao Zhuang College,Nanjiang,210017,Jiangsu,China)

In the statistical application domain,the importance of statistical steady lie in that it still could make statistical processing to maintain the good stability when it has a few unusual value situation in the sports scientific research ,the data collection process caused by multi-factor influence the data which collects to combine frequently the assayer.Through the analysis to athletics sports subjective grading data,present processing means robustness and proposed from the transformation angle non-parameter transformation means enhancement statistics treating processes robustness,the real diagnosis research indicated ,has the feasibility and the feasibility to subjective grading data implementation non-parameter steady transformation during guarantee result valid.

subjective grading data;robustness;athletics sports

2007-02-18

彭大松(1979-),男,安徽潜山人,教师,硕士,研究方向:运动计量学。

猜你喜欢
稳健性裁判员主观
短道速滑裁判员的临场执裁能力及其培养路径
加一点儿主观感受的调料
后印象
会计稳健性的定义和计量
挣多少钱,才可以买到快乐
会计稳健性的文献综述
不确定性、会计稳健性与投资效率
我国高水平女足裁判员培训现状调查
会计稳健性的经济后果研究述评
对立与存在