美国中小学增值评价改革的经验及启示

2021-07-27 17:36雷晓艳
教学与管理(理论版) 2021年7期
关键词:学业公平评价

摘   要

增值评价是国际上最前沿的教育评价方式之一,它关注所有学生最充分的发展,承认学校资源禀赋和学生起点水平的差异,以学生学业成就进步幅度为评价尺度,并以此估算学校和教师对学生进步的“净效应”,使评价更为客观公正。美国田纳西州的增值性评价系统改革最成功,也最值得借鉴,该系统通过追踪所有学生连续多年的学业净增值,运用数据统计模型,评价学校系统和教师对学生学业产生的影响,为教师、学校和教育主管部门有针对性决策提供了基于数据的证据。显而易见,增值性评价能科学精准地推进教育公平,是我国教育不均衡背景下的必然选择。

关键词

增值性评价  教育不均衡  教育公平  教学效能

长期以来,我国教育评价往往以原始分数絕对值的高低为标准,对学校教育效能作出判断。这种以追求升学率为目标,以抢夺优质生源为重点,以获取资源倾斜投入为动力的传统学校评价模式,不仅不利于学校的健康发展,还不利于学生的成长。与之不同,增值评价(Value-added Assessment)承认学校资源禀赋和学生起点水平的差异,以学生学业成就进步幅度为评价尺度,能够最大限度体现评价的客观公正性。2020年6月30日中央全面深化改革委员会审议通过的《深化新时代教育评价改革的总体方案》提出了“改进结果评价,强化过程评价,探索增值评价,健全综合评价”的评价方案。自此,探索增值评价成为国家教育战略的重要组成部分,其理论和实践价值不可谓不重要。故而,本文立足于增值性评价基本理念,分析了美国,特别是美国田纳西州增值评价改革的成功经验,并结合中国教育不均衡的现实,具体指出了美国增值性评价改革成功经验可以借鉴之处。

一、美国增值性评价改革的理念改变

历史地看,美国推动增值性评价改革的根源在于学校教育中评价理念的转变,但这个过程并非一蹴而就,而是经历了一个漫长的发展和形成过程。评价理念的转变,最初始于对教育机会平等问题的关注。1966年,詹姆斯·科尔曼在进行大规模调查研究的基础上,向美国国会提交了《关于教育机会平等的报告》。该报告的突出特点是重新界定了教育机会平等内涵,科尔曼认为教育机会平等不是指教育投入差距的缩小,而是指教育质量的提升,教育机会平等的学校不仅仅意味着资源获取的平等,还包括教育效益平等,学校评价就是要关注学生的发展空间,在教育投入与产出间进行综合测算。与以往教育评价不同,科尔曼关注的重点是学校教育对学业成就的影响程度与实际效益。报告虽没有直接提出增值评价概念,但其结论却体现了教育公平内涵,催生了增值评价的出现。20世纪70年代,增值评价研究在美国逐渐发展起来,尤其是随着计算机的广泛运用以及现代统计技术的发展,增值评价在数据分析方面获得了有力支撑。1983年,《国家处于危机之中:教育改革势在必行》报告出台,针对美国中小学教学质量滑坡、学生学业成就下降的现状,各州开始大力推行教育改革,核心目标就是提升教学质量。为评估教育改革的效果,增值评价被广泛运用。田纳西州率先开发了增值评价系统,达拉斯州也开发适用于该州的增值性评价系统,宾夕法尼亚州和俄亥俄州等数百个学区将增值评价用于学校业绩考核。2001年,《不让一个孩子掉队》出台,更加明确规定学校评价要使用年度进步值这一关键指标,要求通过高标准和效益核定来实现教育平等。故而,增值评价逐渐成为美国中小学评价的主流方式。具体来说,与之前的教育评价相比,增值评价在理念上发生了三方面变化或者说具有三个方面的特点,也正是因为这三个特点才促使美国大力推动增值性评价改革,并在实践中取得较好的效果。

1.由终结性评价转向发展性评价

终结性教育评价是一次性评价,它最常用的评价依据是学业测试分数的绝对值,以及由此衍生出的升学率、优秀率等统计指标,并基于此来判定学校教育及教师工作成效。这种评价方式的指标单一,统计过程简单,变量设置不科学,过于倚重一次性考试结果。最为重要的是,终结性评价关注的是少数优秀学生的培养,而忽略了绝大多数学生的发展预期,损害了教育过程的公平性。与之相反,增值评价关注学生的发展增量,评价的重点是学生学业成就的增值情况,倡导学生与过去的自己比较。横向上看,增值评价不关注一次性考试成绩或者学校的一次性排名,而是从增长的视角,依据横向变化空间来判定其是否获得了预期进步;纵向上看,增值评价的常模参照时间从某个时间点拉长到一段时期内,关注一段时期内学校或教师对学生学业成就的持续性成长和进步的影响。

2.由产出性评价转向绩效性评价

产出性教育评价不考虑资源禀赋差异,不对教育起点进行评估,只强调最终教育产出。一方面,产出性评价违背了公平原则。由于只考虑产出结果忽略起点水平,因此争夺到优质生源的班级和学校处于优势地位,即使学校教育效能不高、教师工作绩效不突出,学生仍然有可能取得较好的学业成就。反之,由于学生的起点水平低,即使教师本身的教学工作出色,学生仍可能无法取得预期学业成就,教师的工作绩效因此被忽略。另一方面,产出性评价方式是不精确的。学生学业成就的影响因素众多,既有学生自身能力水平的原因,也受家庭背景、班级氛围、社会环境等影响,教育产出是这些影响因素共同作用的结果,分数无法精确反映学校教育和教师的作用。增值评价则根据绩效理念,在变量设置上引入了学业水平基准,并控制难以测量的影响学生学业成就的变量,重点分离出学校或教师对学生学业进步的单独贡献,“是在考查‘输入和‘过程的前提下强调‘产出,反应的是学生学业水平的‘净效应和学校或教师工作的实际效能”[1]。

3.由选择性评价转向诊断性评价

选择性评价在目的上偏重鉴定、选拔功能,而不注重教育改进作用。选择性评价遵循“竞争—淘汰—竞争”的逻辑,擅长制造学业“失败者”,而不是帮助学生获取学业成功,极易挫伤大多数教师的工作积极性。与之相反,增值评价基于追踪设计的研究,能提供非常详细的数据,为学校教学提供诊断信息。一方面,增值评价能够提供有关学校教育的过程性信息,呈现学校教育的实际效能,为人才的培养提供“因材施教”的依据;另一方面,增值评价以公平的责任尺度,在准确了解评价对象信息基础上析出“问题域”,“学校可以从中分析和认识自身的教学质量、发展趋势和优势不足等,作为改善教学管理、提升教学成效的参考和依据之一”[2]。

二、美国田纳西州增值性评价改革的成功经验

研究得知,美国多数州都采用了增值评价模式,不同之处主要在于各州对要素设定和数据统计模型的选择。总的来看,美国田纳西州增值评价(Tennessee Value-Added Assessment System,TVAAS)体系运用实践多,体系发展较为完善。这一评价系统通过追踪所有学生连续多年的学业净增值,运用数据统计模型,评价学校和教师对学生学业的影响。该系统可提供评价学校和教师工作绩效的数据,也可为教育行政部门、学校决策层提供基于数据的证据。从本质上讲,TVAAS是一种基于学业测试大数据和数据挖掘的统计技术,不仅需要强大的硬件支持,统计软件和程序开发也必不可少。在具体运用中,有效的增值评价主要包括采集数据、数据分析、形成报告及结果运用等四个阶段。

1.分析数据采集

归集汇聚大样本、全流程、精确化的学业测试大数据,是开展数据分析和数据挖掘的前提条件。因此,田纳西州整合了各类学业测试,精准收集记录学生学业成绩的大数据。TVAAS主要分析全州3至8年级学生共5门学科的学业成绩,包括数学、阅读、语言艺术、社会科学和自然科学,分析数据主要来源于“田纳西州综合评价项目”(Tennessee Comprehensive Assessment Program,TCAP)。田纳西州参考美国州际共同核心标准,结合田纳西州教育实际,形成了以TCAP为主的全州学业水平测试体系。每年3月下旬或4月上旬,田纳西州教育部门组织对全州3至8年级学生进行学业测试。测试结束后,田纳西州的州测验和评价中心(the State Testing and Evaluation Center, STEC)负责试卷批阅,汇总形成测试分数。随后,测试分数送交到田纳西大学的增值研究和评价中心(Value- Added Research and Assessment Center,VARAC),由VARAC负责对数据进行分析。

2.数据整合分析

由于學生测试分数是多个变量共同作用的结果,而TVAAS需要剥离无关变量的影响,分析出学校教育和教师工作的“净效应”。因此,纳入TVAAS分数数据库中的数据不仅仅是学生测试分数,还包括汇聚到数据中心的其他相关资料。比如,学生、教师、学校及学区的档案袋资料,其他背景资料,并且这些资料是按年度更新,并与被评价对象完全匹配。TVAAS首先定义了这些控制变量,再给变量赋值,分析过程产生了相对无关变量值,被纳入统计过程并作出相关分析。然后,“学生多年的测验成绩经过一系列的整合,便可与教师、学校及学校系统联系起来。将静态孤立的数据联系起来,从而形成一套有机的数据,使得VARAC能够追踪学生连续若干年的学业进步”[3]。TVAAS通过对数据的分析、使用、比较,可以及时发现学生学业成就的变化波动,并从中判断出学校和教师的实际工作绩效。

3.解读报告发布

TVAAS评价报告形成后,将以报告单的形式公布。教育部门、学区、学校和教师,可以根据各自的信息需求,获取不同的增值报告单。报告单主要有以下几个显著特点:一是体现增值性。报告不判断一个学校的“好”与“坏”,而是提供一个学区的进步情况,并以此来评价教师、学校及学校系统的效能。TVAAS认为很多情况下,“好学校是以资源过度投入来换取办学效益的,而实际上,一些所谓的差学校可能在教育教学管理上取得的工作绩效更大”[4]。二是体现针对性。TVAAS报告单不是对学业成绩的笼统评价,而是可以清晰呈现出每个学生每一个测试、科目和年级上的进步信息。三是体现预测性。基于长时段跟踪统计,报告单提供了关于学校和学生个体在接下来可能达到一定水平的概率,以引导学校和教师更加有效的规划课程和教学方案。

4.评价结果运用

首先,评价结果是学校评价的依据。TVAAS超越了直观经验判断,评价结果实证化。田纳西州教育部门规定,如果学校的TVAAS评价结果连续多年高于预期增长,学校的综合评价名次将上调;如果学校的TVAAS评价结果连续多年低于教育部门设定的预期增长,学校综合评价将下调;如果学校TVAAS评价结果长期没有达到预期标准,学校将被列入整改名单,教育部门和学区将依据TVAAS评价报告信息,制定学校改进计划和援助方案。其次,评价结果是改进教学的依据。随着新一代信息技术的发展,TVAAS结果的可视化程度逐步提升,基于评价结果生成教学图表、教学报告成为可能,教师可以随时查看、查询和提取到每一个学生学业成就状况,并利用分析系统的变量关联模型,得出学业成就进步率。同时,教师还可以利用TVAAS结果,对自身教学行为进行精确干预,从而提高课堂教学质量。最后,评价结果是资源配置的依据。教育资源是典型的公共产品,它的配置过程需要克服投入不足与资源过剩双重矛盾,既要注重效率又要兼顾公平。TVAAS的评价结果给教育决策者提供的信息是详实的数据智慧,决策者可以查看到不同学校的增值情况,为进一步优化资源在校际间的配置,遏制学校资源争夺,激励更多学校的全面发展,推进教育公平提供依据。

三、美国增值评价改革对我国的启示

我国不同区域之间资源禀赋差异较大,尤其是优质教育资源在东中西部和城乡之间分布不均。在此背景下,推进教育公平需要引入增值的视角,在充分评估生源差异、办学条件差异等因素基础上,以增值评价促进教育公平。在具体措施上,美国增值评价有以下几方面值得借鉴和参考。

1.以促进增值为内涵推进教育公平

以往推进教育公平的实践中,往往把重心放在教育资源获取的公平性上,如强调资源平均分配、师资均衡配置等,却忽略了教育对象的差异性,缺失了过程和结果公平的视角。事实上,教育公平的本质更多地体现在过程与结果公平上,即让每一个孩子都有获得感。真正意义上的教育公平,“并不是需要每个来自不同背景的学生在学业成绩上完全的平等,而是将教育无法控制的那部分变量排除了之后,只考虑教育系统自身的变量对学习成绩所造成的影响”[5]。长期以来,我国对学校的评价都将外部办学硬件、考试成绩及升学率、师资配备情况作为核心指标,而忽略了投入与产出的比值,忽略了学生个体的获得,这样的评价导向往往产生了新的教育不公平。从这个意义上看,“增值评估模式为我们重新评价和认识学校,尤其是弱势学校的教学质量提供了一种新的视角,即评价指标以教学效果代替教育质量,引入增值的概念”[6]。以学校增值为内涵推进教育公平,就是要在充分考量学生起点水平变量基础上,以学生学业成就的进步程度为评价标准。如此一来,学校评价关注的是学校教育对学生的“持续影响力”,评价的重点是长时段内评估对象的进步幅度。这种评价有利于在教育资源禀赋差异较大的情况下,更加准确的评价学校教育的实际效能,进而提高教育质量和保障教育结果公平。

2.建构公平导向的增值评价体系

学校增值评价的实施是体系化过程,涉及指标选择、工具编制、样本选择、数据采集、数据分析等多个步骤,每个环节都关系测评结果的准确性与科学性。首先,设计合理指标评价体系。增值评价并非对我国现有学业水平评价体系的全盘否定,而是不断的完善拓展。因此,增值评价指标体系建构中要注重加入现有评价指标体系的合理因素,同时体现出“增值”与“净效应”特征,关注学生的学业成长,并编制相应的测试工具。其次,大样本收集数据。增值评价对样本规模、数据质量等都有严格的要求。“增值评价是一项追踪研究,至少要对同一批被试进行两次测查。追踪测试的时间越长,测试的次数越多,则越能够精确地实现对学校效能的估计。”[7]因此,在实施学校增值性评价时,要结合已有的学业水平测试项目,统筹规划大规模学业测验,形成教育大数据中心,为实施增值评价奠定基础。再次,建立数据分析系统。评价需要建立系统平台,开发增值评价模型,凸显增值评价变量,为客观、公平的评价奠定基础。最后,形成和发布报告。基于准确评价基础上形成评价报告,及时向教育部门、学校和社会公众公开,由权威专业人员对相应的结果进行充分的解释,发挥增值分数的引导作用,促进学校的均衡发展。

3.调动多方力量参与增值评价

田纳西州学校增值评价的实施过程,有多个部门和专业技术力量参与。州教育部负责组织实施年度TCAP测试,为评价提供大样本数据。统计学专家威廉·桑德斯教授及其团队设计了增值评价模型,并不断迭代更新完善。各学区、学校、教师乃至家长,都积极为评价数据总库提供关于学生的家庭背景、个人信息等数据,为增值评价提供支撑。田纳西大学测验和评价中心负责数据汇总,利用大数据和数据挖掘技术开展增值评价,形成评价报告。目前,我国只在少部分地区开展了增值评价试验,大规模推广扩展还不具备条件。因此,要整合多方力量参与学校增值评价。增值评价的实施涉及到复杂的统计过程,需要建构统计指标体系,开发相应的数据模型,评价与管理人员需要具备统计学知识。收集数据样本有严格要求,需要打通学业测试信息之间的“数据孤岛”,进行有效链接和整合,并运用相应的数据分析技术生成评价报告。因此,要为实施增值性评价借助多方力量,加速推动增值评价的应用实践。

4.运用评价结果推进教育公平

在公共管理领域,很多权威评价结果都面临“一评了之”“为评价而评价”“评价结果束之高阁”等问题。因此,要打通评价结果的吸纳运用渠道,增强增值评价结果的权威性,充分发挥其实际运用价值。从统计学角度看,基于大数据及数据挖掘技术的支持,学校增值评价能够满足不同对象对评价信息的多元需求,为使用者提供个性化的信息。从教育行政部门角度看,增值评价结果为调整教育政策提供了决策参考。比如,根据评价信息更加合理的优化师资结构,更科学进行整体归因分析,更公平的配置区域教育资源,更具针对性的帮助“薄弱”学校,促进教育公平。从学校层面看,增值评价数据具有教育诊断功能,能够帮助学校进行自我检查与评估,发现存在的根源性问题,实现从获取资源投入到注重学校内部管理转变,并采取针对性的改进举措,提升教育教学质量,以此保障每一位孩子充分、公平的发展。从教师层面看,增值评价结果是考核教师效能的重要指标,也是帮助教师调整教学策略、改进教学不足、提高教学能力的重要依据。从家长角度看,增值评价结果能够清楚地展示学校教育孩子学业水平带来的“增值”效应,为家长提供学校教育的真实信息,引导家长合理预期,让每一个孩子获得公平的发展。

参考文献

[1] 边玉芳,孙丽萍.教师增值性评价的进展及在我国应用的建议[J].教师教育研究,2015(01):88-95.

[2] 范美琴,杨从意,朱文琪.“大评价观”视野下的增值评价路径分析[J].中国考试,2017(12):4-8.

[3] 徐丹,牛月蕾.教育增值评价先行者—美国田纳西州教育增值评价模式解析[J].教育科学,2012(01):83-87.

[4] 马小强.尝试以学校增值评价推进教育公平[J].山东教育:中学刊,2007(03):60-61.

[5] 辛涛,黄宁.教育公平的终极目标:教育结果公平[J].教育研究,2009(08):26-29.

[6] 张丽娟.增值评估:一种发展性的学校评估模式[J].天津电大学报,2006(04):18-20.

[7] 边玉芳,王烨晖.增值評价:学校办学质量评估的一种有效途径[J].教育学报,2013(01):43-48.

[作者:雷晓艳(1979-),女,陕西澄城人,周口师范学院教育科学学院,讲师。]

【责任编辑  郭振玲】

猜你喜欢
学业公平评价
公平对抗
艰苦的学业
怎样才公平
中药治疗室性早搏系统评价再评价
音乐提升学生学业表现
树起学业担当之心
笨柴兄弟
公平比较
基于Moodle的学习评价
35