《国家学生体质健康标准》测评结果科学性分析
——基于测量评价学基本理论

2024-05-04 05:00桂春燕刘鑫
当代体育科技 2024年8期
关键词:效度信度体质

桂春燕 刘鑫

河南理工大学体育学院 河南焦作 454003

学生体质健康对整个国家、整个民族至关重要。2016 年国务院颁布《“健康中国2030”规划纲要》,把健康摆在了优先发展战略位置上,强调要提高全民的身体素质,加大学校健康教育力度。我国《国家学生体质健康标准》(以下简称为《标准》)是学校对于《国家体育锻炼标准》的具体实施,目的是鼓励在校学生自觉锻炼身体,促进学生体质健康发展,促使学生身体正常发育和全面发展,增强体质,纠正和改进学生体质健康状况的突出问题,引导学生努力拥有健康的体魄和健全的人格。同时,《标准》也是学生体质健康的个体评价和学生是否能够毕业的基本条件之一。因此,国内关于此方面的研究非常丰富。

目前,研究多集中在学生体质测试结果的数据分析[1],存在问题[2]及公示的困境与出路[3],测试实施的困境及对策[4-5],影响学生体质健康的相关因素及发展对策[6],关于学生体质健康研究的研究综述[7],体质健康标准测试指标体系的演进过程、演变特点[8-10],国内外体质指标体系的对比分析[11-12],体质评价方法研究[13],对《标准》本身进行评价[14-18]等方面。本文通过文献资料法、观察法、逻辑分析法,基于测量学“三性”理论和评价学基本理论对我国执行的《标准》测评结果的科学性进行相关评述,期望我国《标准》测评能够更具有科学性、适用性。

1 体质、健康的概念及范畴

1.1 体质的概念及范畴

体质,即人体的质量。我国体育界学者认为,体质是人体在遗传性和获得性的基础上表现出来的人体形态结构、生理机能、身体素质、心理品质和适应能力等相对稳定的特征[19],其主要涉及以下内容。(1)身体形态发育水平:体格、体型、姿势、营养、身体成分等。(2)生理机能水平:机体新陈代谢水平及各器官系统效能。(3)身体素质和运动能力发展水平:速度、力量、耐力、灵敏、协调、柔韧和走、跑、跳、投、攀、爬等。(4)心理发育水平:本体感知能力、个性、意志、情感等。(5)适应能力:对内外环境的适应能力和对疾病的抵抗能力。

1.2 健康的概念

健康一词有着丰富的内涵,《辞海》中将其定义为人体各器官系统发育良好、功能正常、体质健壮、精力充沛并具有良好劳动效能的状态[19]。1946年世界卫生组织将其界定为:健康乃是一种在身体上、心理上和社会适应方面的完好状态,而不仅仅是没有疾病和虚弱的状态。1989年世界卫生组织又进一步深化了健康概念,认为健康应包括躯体健康、心理健康、社会适应良好和道德健康。可见,健康的概念很广泛,它涵盖了生理、心理和社会适应3个方面,而且它的概念也会随着社会的发展和研究的不断深入而更新变化。

2 历次国家学生体质健康标准的指标体系

通过收集文献资料,查阅并整理了我国历次学生体质健康标准指标体系及评价(见表1、表2、表3)。表1 为2002 年《标准》(试行方案)指标及评价,涉及学生身体形态、生理机能和身体素质的相关指标,但没有涉及心理发育水平和适应能力。小学四年级以下更注重身体形态的评价,五年级及以上更注重心肺机能和速度力量素质的评价。身体素质的相关指标主要供学生进行选择性的测试,但实际不是学生自己选择,而是各个学校自由选择统一测试项目,在选择的过程中,教师会选择学生容易通过的项目。如评价大学生心肺机能的项目中,一般学校会选择台阶试验,因为学生惧怕1 000 m 和800 m 跑,教师在学生进行耐力跑时心理压力也比较大,台阶试验对于教师和学生更容易把握。

表1 2002年《国家学生体质健康标准》(试行方案)指标及评价

表2 2007年《国家学生体质健康标准》指标及评价

表3 2014年新的《国家学生体质健康标准》指标及评价

2007年正式颁布的《标准》(见表2)在2002年试行方案的基础上增加了篮球、足球及排球的基本技能,能充分评价学生的运动能力,但都是选测项目,很多学校在测试的过程中避重就轻,选择容易得分、容易测试的50 m跑、立定跳远项目,所以三大球的基本技能指标设置形同虚设。

2014新修订的《标准》(见表3)全部为必测项目,目的是追求公平,反映心肺机能的肺活量在所有年级中都需要测试。另外,身高标准体重用国际通用的指标BMI表示,删除了三大球技术的基本技能测评项目。

3 基于测量学“三性”理论对《标准》测评结果的分析

3.1 测量结果效度分析

3.1.1 测量有效性基本定义

测量的有效性即效度,是指测量的结果(成绩)真实地反映测量目的的程度[19]。《标准》测量的目的是综合评价学生的体质健康水平,促进学生体质健康发展,激励学生积极参加体育锻炼。但是,从《标准》(试行方案)、正式的《标准》到新修订的《标准》,指标集中在评价身体形态、身体素质及生理机能上,并没有包含体质与健康概念及范畴所涉及到的心理发育水平及适应能力。所以《标准》的测量指标不全面,测试结果无法完全满足测量目的,有效性值得质疑。

3.1.2 影响测量效度的相关因素

影响测量有效性的因素主要包括测量的可靠性、受试者总体特征以及测量的难度和区分度等。

我国地域辽阔,东西南北气候、饮食和生活习惯等差异很大,人体的身体形态、身体机能、身体素质以及心理状态也存在较大差异,而《标准》为了追求所谓的公平,全国用唯一一套测试指标和评价标准来测量评价学生的体质健康状况,影响了测量的效度,因为它对受试者总体特征考虑不够充分,降低了测量结果的效度。

部分指标的难度和区分度不够,以2014 年新《标准》为例,从测量实践中观察到,反映学生肌肉耐力的男生引体向上和女生仰卧起坐,女生很容易达到仰卧起坐的标准且容易拿到高分,而绝大部分男生引体向上在及格分以下甚至零分,所以指标的选取很难达到满足效度要求的区分度和难度。只有测量难度适中,区分度高,有效性才会提高。反之,效度会降低[20]。

测量过程中由于部分学生和体育教师不配合而影响测量的可靠性,也会引起效度的降低。效度的降低会加大测量的误差,就难以真实反映现今学生的体质健康状况。用误差较大的结果作为学生评奖评优、毕业与否、学校体育工作开展情况评价的一个重要条件,有失公平性和科学性。

3.2 测量结果信度分析

3.2.1 测量信度基本定义

信度即测量的可靠性是指在相同条件下对同一批受试对象使用相同的测量手段,重复测量结果的一致性程度[19]。目前,很多学校在体育课上由体育教师完成《标准》的测试,测量结果在很大程度上取决于体育教师和学生的配合。

3.2.2 影响测量信度的相关因素

影响信度的主要因素有测量误差(包括测试者、受试者、测试仪器、测试方法、测试环境、抽样误差等)、受试者个体差异、受试群体的能力水平、测量指标的类型、测试细则等方面。

通过对近10 年大学体育教学的观察,发现有些院校鉴于人力、财力的考虑将体质健康测试工作安排在体育课上进行,在一定程度上增加了体育教师的工作量,很多学校测试的数据都是人工记录。部分体育教师消极对待年复一年的测试工作,测试过程中不亲自到场,对学生监督不够,数据随便填写等现象影响了测量的信度。

测试仪器不统一,测试器材的原理、型号差异明显,仪器的误差存在范围不一致[15],测试仪器出现破旧故障而没有及时维修,都会导致测量误差增大。由于仪器少而参加测试学生多,有时测试人员无暇顾及测量值的真实性,直接将学生报告的测量值录入,影响了测量的可信度[20]。另外,由于测试结果关系到学生的评奖评优及毕业等,部分学生在测试过程中寻找代测人,甚至有人以此搭建一条利益链,严重干扰了测量结果的可信度。还有部分学生在测试过程并未尽力,对照标准认为及格即可,这种主动配合的测试也可能导致测量结果可信度不高[20-21]。

受试者群体能力水平及测试细则影响信度。以某高校为例,每年新生的测试都安排在学生军训后马上完成,因为要完成上报测试数据的任务,学生还没有完全了解测试的目的和具体要求,加之部分体育教师对此测试的细则不进行详细的讲解,大一的学生就在迷茫中参加了测试,从而降低了测量结果的信度。也有部分高校大三、大四学生的测试实际上是安排在大二完成的,并不能反映受试群体在某一阶段的体质健康状况,测量结果的可信度降低。另外,我国地域广阔,受试者群体的能力水平差异比较大,用统一的测量指标进行测试,其信度值得质疑[9]。

目前,新《标准》测试指标不足以反映学生的体质与健康状况,测试项目也趋于简单,效度的高低也直接影响信度的高低。鉴于对以上多种因素的分析,我国《标准》测试的可信度相对较低,未能真实实现测试要达到的目的。

3.3 测量结果客观性分析

测量客观性是指不同测试者对同一受试对象同时测量,通过测量结果的一致程度来衡量测试者误差大小[19]。影响客观性的因素主要包括测试者水平、测试的规范化及标准化程度、测量指标特征及测量尺度。《标准》的测试者一般是学校的体育教师,很多教师没有经过专门培训,并且教师对测试的积极性并不高,甚至有的教师认为每年两次的测试是浪费人力财力,所以部分测试者并没有认真完成测试工作,会对测量结果的客观性产生较大影响[20]。《标准》测试原则上是规范化、标准化程度较高的,但在实际测试过程中,测试者和受试者并没有真正按照规范的流程进行,测量尺度的把握也差异较大,在一定程度上也影响了测量的客观性。

3.4 测量“三性”关系分析

测量的效度、信度及客观性是用来衡量测量误差大小的指标。要想提高测量结果的科学性,客观性、可靠性和有效性都必须提高,三者缺一不可。可靠性是有效性的必要条件,而非充分条件。有效性是可靠性的充分条件,即有效性高,可靠性一定高。所以用“三性”水平都不高的测量数据去反映学生体质健康状况缺少科学性,《标准》要达到的目的和实现的意义很难完成,评价学生体质健康的结果值得质疑。

4 基于评价基本理论对《标准》评价方法进行分析的结果

评价是对所获得信息进行加工处理,通过科学的分析作出价值判断,并赋予被测事物或现象某种意义的过程。评价类型可分为相对评价、绝对评价和进步度评价。评价标准可分为绝对评价标准即参照标准、相对评价标准即常模标准以及动态评价标准。目前《标准》采用的评价类型是相对评价,评价标准为常模标准。相对评价是评价个体在群体里的基本状况,相对评价标准的制定是以学生样本体质测试的平均成绩为常模的,如果学生整个群体的体质健康状况不容乐观,那么即使学生被评为优秀等级,学生的体质健康状况也未必就好,这样可能会给学生参与体育锻炼造成误导。因此,相对评价和常模标准很难定位学生体质健康状况到底如何,对于不同年龄段用何种标准能够真正达到体质健康的要求,学生通过完成这一测试无从知晓。

建议《标准》的评价标准采用常模标准和参照标准相结合的方式共同使用,同时在评价系统内设计学生进步度评价标准。虽然制定各年级参照标准比较困难,但鉴于学生体质健康的现状,相关教育者和专家有责任有义务去研究设计,只有这样,学生才能通过《标准》的测试,真正清楚自己体质健康的实际水平,《标准》才具有实际存在的价值。设计进步度评价有利于学生同自己的以往成绩比较而判断进步程度,更能调动锻炼身体的能动性,而不仅仅停留在为了拿到评奖评优、毕业资格的功利性动机上。学生的体质健康状况问题是客观事实的,“少年强则国强”,青少年的体质健康状况是不容忽视的,它关乎国家的未来和民族的希望,所以,即使参照标准设计难度较大,这个问题也必须解决。

5 结语

我国《国家学生体质健康标准》的制定从2002年试行到2014 年重新修订花费了许多专家学者、体育工作者们大量心血,它的测量及评价也花费了大量的人力、物力和财力,在国内已具有很大的影响力,成为各级学校及学生家长关注的焦点问题之一,也是体质研究者们重要研究的话题之一。但《标准》本身的指标设置、执行过程及评价标准的科学性影响了测量结果的真实性,按照测量学“三性”基本理论评价,其科学性是较低的,评价标准的设计也无法真实反映学生的体质健康状况。建议《国家学生体质健康标准》的名称改为《国家学生体质标准》或《国家学生锻炼标准》,因为健康的内涵是很丰富的,这样的测试是无法评价学生健康状况的,指标的设定要更多地选用真正测量学生身体素质及运动能力的指标,学生只有掌握了基本的运动能力如球类运动等,才会更有方向性地参加体育锻炼,进而提高身体素质,增强体质。心理指标和社会适应能力指标是比较敏感而复杂的,也比较难以量化,但从《标准》名称来看,应该包括两者的相关指标,为了防止学生鉴于达标的考虑而造成测量结果的不真实,可以设置相关指标,但可不计入体质总分。评价标准的设定可采用常模评价、参照评价和进步度评价相结合的方式,用更科学的方法去测量和评价学生真实的体质状况,真正调动学生参加体育锻炼的主动性。

本研究旨在为出台其他相关政策奠定坚实基础,为真正贯彻执行《“健康中国2030”规划纲要》做出贡献,为实现“健康中国2030”做出努力。

猜你喜欢
效度信度体质
中医“体质”问答
中医“体质”问答
中医“体质”回答
《广东地区儿童中医体质辨识量表》的信度和效度研究
28天吃出易瘦体质
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架