高中学业水平考试评价标准体系研究
——以北京市为例

2017-06-05 14:59任涛扈岩张青华张泉利
中国考试 2017年1期
关键词:普通高中学业试卷

任涛 扈岩 张青华 张泉利

(北京教育考试院,北京 100083)

高中学业水平考试评价标准体系研究
——以北京市为例

任涛 扈岩 张青华 张泉利

(北京教育考试院,北京 100083)

考试评价研究的科学、全面发展,对促进基础教育的均衡发展、减轻学生负担、提高教育教学质量都将产生重要影响。本文以设计和构建高中学业水平考试的评价标准为切入点,建立试卷评价量表,使评价过程标准化以及评价结果可量化,并展示了试卷定性评价与定量数据分析结果,形成试卷质量评价报告的过程,同时为开展个性化的学生诊断评价提供了参考依据。对高中学业水平考试评价标准体系的研究,可以解决招生考试评价标准不足的问题,以期促进新一轮考试招生制度改革顺利实施。

考试招生制度改革;高考;学业水平考试;考试评价;评价体系;试卷质量标准

考试招生制度是国家基本教育制度。2014年12月,教育部出台《关于普通高中学业水平考试的实施意见》,是贯彻落实《国务院关于深化考试招生制度改革的实施意见》的4个配套文件之一,主要目标是建立科学的选拔评价体系和培养体系,改变以往应试教育理念,促进学生全方位的素质发展,培养未来高素质创新性人才[1-2]。自此,普通高中学业水平考试终于有了国家层面的宏观“国家标准”[3]。新的学业水平考试的突出特点是:考试科目全覆盖,考生可以两次选考,成绩以等级形式呈现等[4]。这无疑对于推进新的《课程标准》的顺利实施和高考改革都是大有裨益的[5]。

1 我国高中学业水平考试的历史沿革

我国高中学业水平考试始于1983年的高中毕业会考制度,在《教育部关于进一步提高普通高中教育质量的几点意见》中提出,毕业考试要和升学考试分开进行,有条件的省市可按基本教材命题,试行初、高中毕业会考[6]。1990年《国家教委关于在普通高中实行毕业会考制度的意见》首次强调指出会考的性质,普通高中毕业会考是国家承认的省级普通高中文化课毕业水平考试,它是检查、评价普通高中教学质量的一种手段,是与高校招生选拔考试具有不同性质的考试。从1990年开始,普通高中毕业会考制度有计划地在全国逐步实行[7]。各省市经过10年的实践和探索,针对普通高中进行素质教育,全面培养高素质能力型人才的需要,2000年《教育部关于普通高中毕业会考制度改革的意见》指出,各省、自治区、直辖市对普通高中会考改革具有统筹决策权,不再进行普通高中会考的地方要建立和完善普通高中学校毕业考试制度,要以全面推进素质教育为宗旨,探索建立对学生多方面能力发展的评价体系[8]。

针对高中毕业成绩公平有效的问题、考试内容不规范、评价程序不严谨和省级监控手段不足的问题,高中会考面临重新定位[9-10]。结合高中新课程改革和2010年《国家中长期教育改革和发展规划纲要(2010—2020年)》的颁布,提出建立科学的教育质量评价体系,全面实施普通高中学业水平考试和综合素质评价。普通高等学校本科招生以统一入学考试为基本方式,结合学业水平考试和综合素质评价,择优录取[11]。自此,高中会考正式转为学业水平考试发展阶段。2014年《国务院关于深化考试招生制度改革的实施意见》指出,学业水平考试由省级教育行政部门按国家课程标准和考试要求组织实施,主要检验学生学习程度,是学生毕业和升学的重要依据。通过挖掘、分析学业水平考试数据中蕴藏的教育教学信息,发现中学教学中的问题,对提高普通高中教学质量和学生学习水平大有裨益,因此构建学业水平考试评价标准体系变得十分重要[12]。

2 设计高中学业水平考试评价标准的目的

考试是培养选拔人才的复杂系统工程,其所涉及的命题技术、制卷要求和考试评价需要通过一定的标准来进行规范和指导,以保障教育考试的有序、有效开展[13]。制定学业水平考试试卷评价标准,作出统一规定,其目的在于获得教育考试发展的最佳秩序并提升教育水平[14]。

高中学业水平考试的性质和作用,从国家层面看,是按照国家课程标准,在教育部指导下,分别由各省自行组织实施的对普通高中学生学业水平进行检测的标准参照考试[15]。北京市目前仍以会考的形式进行,概括地说,其作用主要有以下几个方面:一是考核普通高中学生相关科目学习是否达到课程标准要求,能否达到各学科课程的毕业标准;二是反映普通高中学校实施高中课程标准的情况和教育教学质量及办学水平;三是便于各级教育行政部门进行普通高中课程管理,督促学校认真执行课程方案和课程标准,规范教育教学行为;四是为高等学校招收新生提供依据;五是为高中学生就业或接受国内外各类教育提供高中学业水平证明。

2.1 监控高中学业水平,明确考试评价标准

高中学业水平考试与高考有本质的区别,就考试内容而言,考试标准主要是强调通过质和量来规划高中学段所应达到的具体学业结果,从而建立高中学业成绩评价标准。明确考试内容所涉及的学生认知水平和能力基础,对学生能达到课程相应内容及认知水平的具体特征作出明确规定。

目前正在修订的“新课程标准”和“学业水平标准”中,提出了“学科核心素养”,将每门学科的知识和学科能力具体化,并分水平、分类分层描述,这成为今后考试评价的重要依据。这意味着今后考试评价将通过分析学生的考试成绩,为考生提供准确客观的学业诊断报告,来鉴别考生在学科知识和能力方面的优势和不足,使考生能够选择适合自身未来发展的高校与专业。

2.2 建立试卷评价量表,加强考试结果反馈

按照高中教育课程标准的要求制定学业水平考试的考试内容或内容标准,并着手制定各学科的学业质量标准。根据学业质量标准来命题,并建立试卷的评价量表,及时做好学业水平考试数据统计与分析,以便充分发挥高中学业水平考试数据信息在学业评价、质量检测、教学反馈等方面的影响[10]。分析和反馈不同教师或考生对试卷的评价意见,可以加强对命题的反馈与评价;通过分析预判考生在不同题目上的答题表现,可以对阅卷提供必要的参考,以及了解各层次考生的答卷情况与感受;通过访谈调研、试卷评价量表调研和考后对考生学业水平考试成绩的年度分析,以及纵向的年度分析,对比年度间数据,可以提升试卷命题质量和对教育教学的指导力度。

3 高中学业水平考试评价量表设计

3.1 统计指标和教育测量指标体系

北京市针对全市会考已开展多年的试题质量、学生水平及教学质量分析研究,在对试卷评价分析中,构建并逐步完善了考试评价的统计指标和教育测量指标体系(见表1)[12]。为了使测量结果较为直接地被一线教师和教研人员所理解,一般采用经典测量理论指标来对学生得分进行评价和分析,在一些对学科能力的分析中借鉴了项目反应理论的结果。

3.2 学业水平考试命题评价表

首先对15名有过高考和会考命题经验的一线教师进行访谈,并对访谈资料进行编码,对命题的反馈评价,利用因素分析法和频次分析法[16],考虑的因素见表2。

根据所得到因素进行细化形成开放性问卷,向北京市1 100余位不同学科的一线教师或教研员发放问卷作答,将作答结果进行提炼总结,经过聚类分析[17]得到8类不同维度的评价内容标准见表3。

3.3 学业水平考试试卷质量的定量评价指标

学业水平考试试卷评价量表的建立和使用按照以下思路进行:一是试卷整体评价与个性分析相结合,对学业水平考试试卷具备的功能进行全面评价,同时关注不同学科试卷的特点;二是第三方评价(非命题者和非被试对象的考生),站在第三方的角度开展评价,客观分析试卷是否符合学业水平考试的要求;三是定量评价(客观数据)与定性评价结合,评价教师运用自己教学积累的经验分析统计结果,探究影响教学的种种因素和产生问题的原因,提出改进建议[12]。

通过广泛的专家访谈和10余年的调研论证,得到学科试卷评价量表,评价的维度包括学科《课程标准》的主题与模块分类、教材分布(如数学学科有5个模块)、题型分类(如客观题或主观题)、认知层次(知道、了解、理解、掌握、运用或综合应用)、知识组块、能力组块、学科特色分析等(如语文作文,英语听力,物理、化学和生物实验,物理、化学和生物科普阅读题,地理地图,历史年表,时事政治等等),以及基础性或发展性组块等。表4列出了2016年北京市春季会考物理学科试卷的评价角度和指标。

表1 学科评价测量指标体系

表2 命题定性评价表考虑的因素

表3 命题定性评价表

表4 2016年北京春季会考物理学科试卷评价表(部分示例)

4 结果与展望

4.1 进行学业水平考试试卷定性评价

通过表2、表3所列的宏观或微观评价角度,可以设计对学业水平考试的定性评价报告,在考试后的第一时间,收集教研员或一线教师的客观评价,这样对试卷阅卷标准的把控十分有效。

2016年北京市春季会考结束后,编制了初评问卷通过微信和网络投票的定向调研方式,收集了北京市9个学科教师对试卷的评价,获得有效问卷1 137份,经分析得到图1,其中对9个学科试卷评价为优秀的占62%,良好的占32.1%。了解了一线教师对试卷的评价意见,针对不合格试卷,可以进一步分析评价为不合格的原因,为阅卷标准的把握和撰写评价报告提供参考。

图1 对试卷的评价等级

4.2 进行学业水平考试试卷定量数据分析

利用如表4所建立的试卷质量评价指标对试卷进行科学的分类,如课程标准模块、教材分布、题型分类、认知层次、知识组块、能力组块、基础性和发展性组块等,开发了专业的统计测量分析程序,也可以用SPSS软件或EXCEL进行全样本的考生数据分析,得到如表1中所列各类教育测量指标的数据或图表,这样就获得了学业水平考试试卷的数据报告(见表5),可以进行基于标准的定量数据分析。

4.3 形成学业水平考试试卷质量评价报告

结合学业水平考试的定性调研评价报告和定量数据分析报告,可以按照如表4、表5所列的不同角度着手撰写评价研究报告,内容可以参考表2和表3中列出的方面。这样形成的试卷质量评价报告,不仅对教师评价的过程标准量化、有据可依,也减少了评价报告不客观、不规范、不严谨,评价语言随意性的问题,增加了评价报告的规范和可读性,同时也将试卷的特点特色和不足完全地展现在评价量表上,使教育管理者或命题教师能够一目了然地知悉试卷评价诊断反映出的问题,以便下次命题时改进。

从多年的实践效果看,试卷评价量表能够“迅速”地反映出试卷中表述不严谨、存在科学性错误的试题;存在题目与其答案不匹配、答案不规范、评分标准不清晰的瑕疵;反映出有的学科试卷使用会考说明原题数量过高,原创或改编试题数量太少,致使试卷效度差;有的试卷存在排版不规范,格式不统一等现象或突出问题。

4.4 为个性化的学生诊断评价报告提供依据

充分利用考试数据资源,向学生提供诊断评价报告,为学生个性化学习提供建议和参考。试卷评价的主要作用就是改进教学和拓展考试服务功能,为考生提供个性化评价,有效发挥考试在促进教育教学、改善教育管理、帮助学生学习等方面的延伸功能。构建试卷评价指标体系,可以加强对学业水平考试结果的研究与分析,做好教学反馈与指导,不断提高教学质量。设计科学的试卷质量评价标准,既能作为教师平时教学中进行学生诊断评估的重要依据,又能作为评价准则,实现对学生、教师、学校乃至区域教育质量的科学评测,是提升我国教育质量、实现素质教育的重要保障。

[1]罗祖兵,秦利娟.将学业水平考试纳入高考的困境与对策[J].课程·教材·教法,2015(8).

[2]徐远征.对普通高中学业水平考试命题技术的初步探讨[J].课程·教材·教法,2013(2).

[3]国家教育标准体系研究课题组.国家教育标准体系的发展与完善[J].教育研究,2015(12).

[4]王蕾.大规模考试和学业质量评价[J].教育科学研究,2013(8).

[5]钟秉林.深化综合改革,应对高考招生制度改革新挑战[J].教育研究,2015(3).

[6]李凌艳,郭思文.我国基础教育质量环境系统监测的若干思考[J].教育研究,2014(11).

[7]马嘉宾,王建,汪明.高中考试招生制度改革的问题与建议[J].教育研究,2014(7).

[8]关松林.我国普通高中学生学业水平考试问题分析[J].中国教育学刊,2013(11).

[9]雷新勇.我国学业水平考试的基本问题及反思[J].教育测量与评价,2010(1).

[10]戴家干.教育考试与评价制度创新——理论研究与实践探索[M].北京:高等教育出版社,2010.

[11]杨向东.关于高中学业水平考试的比较研究[J].全球教育展望,2010(4).

[12]朱宇.高中学业水平考试:功能、命题与成绩使用[J].考试研究,2008,4(2).

[13]雷新勇,周群.从基于标准的基础教育改革的视角审视课程标准和学业水平考试[J].考试研究,2009,5(1).

[14]臧铁军.构建考试评价系统的理论与实践研究[J].考试研究, 2013(3).

[15]葛建中,徐远征.让学业水平考试发挥正向引导作用[N].中国教育报,2012-05-17(8).

[16]刘菊香,沈霄凤.用Spss统计软件对学生综合成绩的因子分析[J].统计教育,2006(1).

[17]武森,俞晓莉,倪宇,等.数据挖掘中的聚类技术在学生成绩分析中的应用[J].中国管理信息化,2009,12(15).

Criteria for Evaluating the Academic Proficiency Test for High Schools: A Case Study of Beijing

REN Tao,HU Yan,ZHANG Qinghua,ZHANG Quanli
(Beijing Education Examinations Authority,Beijing 100083,China)

Evaluation of educational assessments being one important aspect,scientific and comprehensive development of research in educational assessment helps promote balanced development of quality education as well as reduce the workload for students.Taking Beijing’s Academic Proficiency Test for High Schools as an example,evaluation criteria are designed for the test,so that the evaluation processes are standardized and the evaluation outcomes are quantified.Results of qualitative and quantitative analysis and processes involved in creating test paper quality evaluation reports are exemplified,which in the meantime provide reference for creating individualized diagnostic assessments.As an effort to contribute to literature on test evaluation,this study is made with a view to promoting smooth implementation of the new round of examination and enrollment reform.

Examination and Enrollment System Reform;College Entrance Examination;Academic Proficiency Test;Test Evaluation;Evaluation System;Test Paper Quality Evaluation Criteria

表5 2016年北京春季会考数学学科数据分析表(部分示例)

G405

A

1005-8427(2017)01-0019-7

10.19360/j.cnki.11-3303/g4.2017.01.004

(责任编辑:周黎明)

本文系北京教育科学“十二五规划”重点课题“北京市学业水平考试(会考)评价体系研究”(课题编号:AHA14168)的研究成果。

任 涛(1977—),男,北京教育考试院,副研究员;扈 岩(1977—),男,北京教育考试院,助理研究员;张青华(1975—),女,北京教育考试院,副研究员;张泉利(1964—),男,北京教育考试院党委副书记,副研究员。

猜你喜欢
普通高中学业试卷
艰苦的学业
谈学业不良学生的教育策略
普通高中
普通高中生涯规划教育的尝试、困境与思考
音乐提升学生学业表现
普通高中文化育人的思考与实践
高中:普通与特色同步发展
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia