高中学业水平考试成绩等第转换问题探讨

2017-02-01 11:10杜习民
中国考试 2017年11期
关键词:赋分标准分正态分布

杜习民

(河南省招生办公室,郑州 450046)

根据《国务院关于深化考试招生制度改革的实施意见》,全国各省(自治区、直辖市)先后公布了深化考试招生制度改革的实施方案,并配套出台了普通高中学业水平考试(以下简称“学考”)的实施意见等文件,上海市、浙江省先行试点并于2017年完成了改革后首届高中毕业生的考试和招生。除上海市、浙江省以外,多数省(自治区、直辖市)的改革方案和实施意见未明确学考等第成绩的赋分办法。学考等第成绩如何转换,等第成绩以怎样的分布状态呈现,如何保证等第成绩与高考统考成绩的可加性是深化考试招生制度改革实施过程中面临的具体问题。

1 学考成绩等第转换的必要性

从各省(自治区、直辖市)陆续出台的改革实施方案来看,大部分省份都采用“3+3”的考试模式。前一个“3”指统一高考的语文、数学、外语科目,后一个“3”为学考选考科目。多数省份采用“6选3”模式,即由考生根据自己的兴趣和学习情况从思想政治、历史、地理、物理、化学、生物6个科目中自主选择3科。浙江采取的是“7选3”模式,除了以上所提到的6科,还增加了“技术(含通用技术和信息技术)”科目,供考生选择。统一高考不分文理科,外语实行一年两考,3个科目的总分均为150分。学考选考科目,各省(自治区、直辖市)的实施方案基本采取按等级赋分,而不直接使用卷面得分,主要原因是选考科目由考生自主选择,如果“6选3”,会有20种不同科目的组合,不同科目考试内容和难度会不同,卷面得分缺乏可比性,若直接组合相加,会因试卷难度、成绩分布不一致而造成合成成绩的不合理。所以,各省都采用按照各科目原始分数排序,再按照排序区分等级进行赋分的办法。等第转换分两个步骤,一是按照考生原始成绩的百分名次确定等级,二是给每个等级按照一定的分布规律赋分。通过转换将不同学科的卷面分数用等级转换赋分的方法放到同一个量表下,使得学科之间的等级分数具有可比性和可加性。

2 学考成绩等级划分的实用性

如果学考成绩作为高校录取等级要求和前提条件而不与高考统考成绩相加使用,其等级越粗越好;而如果学考的等第成绩与高考统考成绩相加使用,其等级划分越细越好。

按照《教育部关于普通高中学业水平考试的实施意见》,学考成绩以5个等级呈现,设计初衷是为了避免分分计较,但在等第的使用上出现了问题。目前的招生录取体制和技术设计,需要将高考统考3科的成绩与学考成绩相加使用。若等级过粗,无法相加使用,学考选考的等第成绩只能作为招生录取的前提条件,即只能采用现行的江苏、海南等省“硬挂钩”办法,会出现依据语文、数学、外语3科成绩录取的问题。因为总分拉不开,也会出现许多语文、数学、外语总分并列的情况,需要解决并列情况的排序问题才能在录取中采用平行志愿投档模式。

高考属于选拔性考试,目的在于区分不同的水平,选拔适合大学培养的学生。如果考试成绩过于集中,将对招生录取非常不利。先期试点的上海市和浙江省采用成绩相加使用的办法,为此对5个等级进行了细分,上海市将学考成绩细化为11个等级,浙江省细化为21个等级。细化等级后按照固定的等级赋分量表进行等第分数转换,并都不同程度地考虑了考试成绩基本呈正态分布的实际情况,中间等级分数的比例大一些,两头等第成绩的比例小一些,以实现等第成绩与高考统考成绩的科学相加。等级分数转换后具有了可比性,等级细分后基本具备了与高考统考成绩的可加性,但因各等级划定人数比例和相邻等级分数级差较大等问题,对于考生人数较多的省份,可以借鉴,但需要进一步细化。其原因:一是这种计分方法造成考生成绩“同质化”问题。即相同总分的考生人数增大,对平行志愿投档造成困难,同时也给同分考生择优带来新的问题。二是成绩分布的间断和跳跃问题。统考科目成绩相邻分数级差为1分,如果按照1分级差的量表来衡量,学考3分级差的分数出现间断和跳跃,若3门选考科目具有相同的等级,与同样具有上一个等级3门选考科目成绩的考生会相差9分,若某考生各科目成绩恰好都处在这个跳跃点上,其3门学考选考科目原始分数各差1分,选考科目的等第成绩会产生9分的差异。对于人数多的省份,为了保证招生录取的公平性,至少要细分为31个等级,要想更加公平的话,应该划分61个等级。各科等第成绩区间为40~100分,如果按照31个等级划分,2分1级;如果按照61个等级划分,1分1级。

3 学考成绩与高考统考成绩相加的科学性

学考选考科目成绩通过等级转换和赋分,科目之间具备了可加性,但学考的等第成绩如何与高考统考成绩综合使用,需要进行研究。20世纪90年代,广东、海南、河南、陕西、广西、山东、福建等省(自治区)实行了标准分制度。进入21世纪,随着“3+X”考试科目改革,根据社会对标准分不理解的反映,除海南省之外的其他省份纷纷取消了标准分制度,回归到原始分制。本轮高考综合改革再次面临成绩转换问题,因此,标准分被重新提及。海南省坚持使用标准分,已经解决了科学设计与被社会理解的问题,为实施考试招生制度改革奠定了基础。标准分转换的科学理念,值得我们在深化考试招生制度改革中借鉴。

3.1 学考等第成绩的可加性

学考成绩需要转换成等第成绩,等第成绩的分布状态也要趋近考生原始成绩的分布状态,这样才能保证学考成绩与高考统考成绩的可加性。一般大规模教育考试考生原始成绩都符合正态分布,但有些考试原始成绩呈现偏态分布。所谓偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布。如一些试题难度小的水平考试,往往呈现负偏态分布。但等第成绩是将原始分数转换成名次分数(百分等级),再将百分等级按照正态分布的概率,转化为等第成绩。这种转化过程本身是正态化的过程,所以,等第成绩符合正态分布。概率论与统计学已经证明正态分布的可加性,即正态分布的独立随机变量和的分布仍属于正态分布[1]。在高考中,无论是原始分还是等第分数,它们的分布状态均符合正态分布,原始分的正态分布图横坐标为分数,纵坐标为考生人数;等第分数的正态分布图横坐标是等第分数,纵坐标为这个分数对应的考生人数比例。成绩相加是横坐标的分数线性相加,只需要保持横坐标分数单位和性质的一致性。

3.2 学考等第成绩与高考统考成绩的可加性

对于学考等第成绩与高考统考成绩的可加性,可以从分析上海市、浙江省两地的试点办法开始探讨。上海市学考各等级考生人数所占比例和赋分见表1,等级转换后的成绩分布状态见图1。

表1 上海市学考各等级考生人数比例和赋分

图1 上海市学考等级转换后的成绩分布状态

浙江省学考各等级考生人数比例及赋分见表2,等级转换后的成绩分布状态见图2。

浙江省细化为21个等级,上海A+等级和E等级各有5%人数,其余等级人数各占10%。河南省2016年普通类考生人数为70万人(浙江省和上海市2016年分别30.7万人和5.1万人),优质高等教育资源不足(2016年985高校在河南省录取1.13万人,录取率1.62%;211高校录取4.34万人,录取率6.2%),如果按照上海市和浙江省的等级划分方案(上海市第一个等级考生占5%,河南省是3.35万人;浙江省第一个等级考生占1%,在河南省是0.67万人),一是选考科目成绩在招生中的区分度过低而且跳跃,不能起到较好的区分作用,这样在招生过程中,报考知名高校的考生中的大多数3科选考科目成绩能够得到满分,最终起作用的仍然是普通高考成绩,重回“一考定终身”的老路;二是考试成绩的分布曲线过于扁平(上海市方案几乎是一条平均分配的直线;浙江省是一个准正态分布的断点曲线),与统考3科成绩相加,基本合理,但不够科学。学考等第成绩的分布曲线应与高考成绩的分布曲线形态基本一致,这样才能保证分布曲线横坐标的分数单位和性质基本一致,使成绩科学相加,达到选拔目的。

表2 浙江省学考各等级所占比例及赋分

图2 浙江省学考等级转换后的成绩分布状态

因此,需要进一步探讨等第成绩正态分布的状态,即要确定学考等第成绩的标准差。

4 学考等第成绩分布形态问题探讨

4.1 学考等第成绩的标准差确定

为保证与高考统考成绩相加的科学性,需要研究学考成绩等第转换后正态曲线的分布状态,而决定正态曲线分布状态的是标准差。通过分析试点省份学考等第成绩标准差,以及河南省近几年学考和高考原始成绩的标准差,得到合理的标准差值,以确定学考百分等级转换后考生赋分的量表。

4.1.1 上海市、浙江省等第成绩标准差分析

上海市学考的等第成绩每个科目取值最高分70分,最低分40分,取值区间30分,平均分为55分。按照标准差计算公式可以算出,等第成绩的标准差为8.75分。浙江省每科满分值100分,以高中学考成绩合格为赋分前提,起点赋分40分,取值区间为60分,平均分为70分,等第成绩的标准差为13.8分。以此平均分和标准差描述正态分布曲线,是两条较为扁平的曲线,说明其离散程度较大,其正态分布曲线与实际赋分的直方图之间还是有较大差别的:一是上海市几乎按照百分等级平均赋分,没有符合平均分左右考生人数集中的特点;二是高分、低分段取值人数较多,未形成平滑无限接近的趋势,在招生中,特别是知名高校的选拔中,学考成绩几乎不起作用;三是横轴等第分数取值3分1段,与横坐标高考统考成绩1分1段的单位不一致,在与高考统考成绩相加时会出现成绩跳跃的现象;四是上海市、浙江省学考等第成绩标准差较大,离散度大,在与高考统考成绩相加时,其作用远远大于既定取值空间30分和60分的作用。

4.1.2 河南省往年学考成绩标准差分析

表3 河南省2013—2015年学考成绩平均分和标准差

从表3可以看出,作为衡量高中毕业资格和在招生中作为参考的学考有以下3个特点:一是作为一项水平考试,各科试卷难度不大,基本上在0.6左右。二是语文学科难度低且标准差小,难度在0.73左右,标准差在8分左右。以2015年语文学科为例,一个标准差范围内,即考分在65分与81分之间的考生约占考生总数的68.3%,符合语文学科的特点。三是数学、物理、化学、生物、英语的标准差较为稳定,基本在20分左右。此外,河南省学生的学考成绩与其高考对应科目成绩的相关系数在0.4与0.7之间,保持着中度相关。

4.1.3 河南省往年高考各科目标准差分析

表4 河南省2014—2016年高考各科目平均分和标准差[2]

从表4可以看出,高考的试卷难度要大于学考;语文、数学、外语成绩的标准差均大于学考。高考文科综合能力测试标准差在33分左右、理科综合能力测试在52分左右,与学考的标准差不同。因此,应该从学考选考科目选拔性特点出发,结合以往高考,特别是文科综合能力测试、理科综合能力测试科目,确定一个较高的标准差,作为学考选考科目等第成绩转换后成绩分布形态的模型。

4.2 学考等第成绩量表

受人们认识的影响,如果不能使用标准分,为了保证学考等第成绩科学地与高考成绩相加,又要便于社会理解,需要确定学考等第成绩的标准差,也就是形成学考等第成绩的分布状态,以便形成按照等第赋分的量表。基于对先期试点省份学考等第成绩、河南省近年来学考和高考成绩标准差的分析,如果学考成绩的赋分范围确定在60分,建议标准差值确定为10分,这样根据正态分布表确定学考等第成绩赋分的量表如表5。

表5 学考等第成绩赋分量表

表5给出各赋值分数上考生所占的比例,对应该表的分数分布曲线如图3。

图3 高中学业水平考试赋值办法成绩分布曲线图

采用该赋分量表,既是以往标准分制度实行时的基本做法,也是将考生学考选考科目成绩按照其百分位次比例进行正态化转换的过程,转换后的成绩符合学考成绩分布的原始状态,可以保证学考成绩转换后与高考统考成绩相加的科学性,符合高考招生的特点。

在使用该量表时需要注意:如果试卷本身难度小、区分度低的话,会出现某些科目成绩转换后没有满分考生。依据量表的特点,按照一定标准差正态化后,在赋分60~100分区间内,名次达到1%的考生分值大约为93分。假设原始试卷区分度不够,出现了1.07%的满分考生,这些原始分满分的考生赋值只能是93分。为了避免上述情况的出现,一是需要按照选拔性考试要求命制学考选考科目题目,提高命题质量,适当增加试题难度;二是适当增长考试时间和题量,将目前学考原始试卷满分100分提高到150分,以提高考试的区分度。

总之,在深化考试招生制度改革的具体实践中,学考成绩如何在考试招生中使用是一个重要问题。本文通过分析,提出了转换量表,并将使用过程分两个步骤,第一步是将考生学考选考科目的原始成绩按照百分比例等级进行排队;第二步是按照量表进行赋分。在具体操作上,要将百分比例名次和对应的等第分数量表提前公布并进行宣传,让考生和家长了解,学考选考科目成绩是名次分,每科考试的成绩首先要转换成百分比例名次,然后再对应到最终成绩。只有这样,才能确保高考改革的顺利进行。

[1]朱德全.教育测量学[M].北京:中国人民大学出版社,2016.

[2]河南省招生办公室.2016年河南省普通高考试卷评析[M].郑州:河南科技出版社,2017.

猜你喜欢
赋分标准分正态分布
关于n维正态分布线性函数服从正态分布的证明*
农业科研系列晋职初审程序电子化方案设计
——业绩赋分
生活常态模式
偏对称正态分布的若干性质
教育厅长因决策失误被责令辞职
基于马尔科夫预测的分层教学下教学质量量化模型
浅析浙江新高考制度下的等级赋分制
高校师生对原始分制与标准分制的感知对比
出新不足,守正有余
基于标准分优化的在线教师教学评价系统设计与实现