能力分班对寒门学子有利吗？
——机会公平视角下教育分层制度的效能与隐忧

2024-03-09 13:08钱阿剑

中国远程教育 2024年3期

钱阿剑赵茜

教育公平作为社会公平的基石，是人们最易感受的公平。而教育分层和筛选制度是其中尤为敏感的部分。弱势家庭学生能否在这些制度安排中获得公平的机会，是公平的重要效标。人们往往以“寒门贵子”的隐喻表达对教育和社会公平的期待。但来自高等教育阶段的研究结论则往往指向“寒门再难出贵子”（郭书剑&王建华,2018;谢爱磊等,2018）。与此同时，却有两类群体信任和支持教育分层的制度。一类是沉默的行动支持者，一些基础教育学段的家长们仍然用“鸡娃”的行动，支持和积极参与他们认为最为公平的各类“考试”和筛选机会。另一类是一群国际研究者，他们认为在超级大国的比较中，中国的教育流动仍然畅通，是最公平的社会系统（桑德尔, 2021,p.76）。可见，普遍存在的教育分层制度到底是否公平仍需深入研究。

本文基于胡森的“教育机会均等”理论，选取弱势家庭学生作为研究对象，讨论初中能力分班制度的公平程度。教育机会公平意味着学生成绩的获得仅取决于自身后天的努力，而不受先赋性因素的影响；一般认为，教育机会公平可划分为起点公平、过程公平和结果公平（胡森, 2009）。本文据此回答三个研究问题：1）在能力分班情况下，弱势家庭学生是否与优势家庭学生有同等机会进入高成绩班级，即起点公平问题；2）弱势家庭学生进入高成绩班级对其成绩提升是否存在积极作用，即结果公平问题；3）能力分班是否是帮助弱势家庭学生隔绝不利环境的“玻璃墙”，即过程公平问题。

一、文献综述

能力分班属于国际研究中被称为能力分组（Ability Grouping）的研究领域。能力分组指的是依据学生的成绩表现、准备程度或能力水平等因素将学生分配到不同的学校、班级或学习小组进行差异化教学的过程，包括课程的差异化以及教学的差异化（Kulik&Kulik,1992;McCoach et al.,2006;Betts,2011）。能力分组在世界范围内普遍存在，关于其对学生发展的影响，研究结论也并不统一（Chmielewski,2014;Ramberg,2016）。2018年PISA数据显示，我国京、沪、苏、浙四省市有将近一半的初中和高中实施能力分班或学科分层，实施班内分层教学的学校占比更高达90.98%。能力分组方式有很多种，包括根据能力进行分班、根据学科不同表现进行学科内分层、根据学科表现进行跨年级分层、班级内部进行分层教学等。在这些方式中，成本最低、简单易操作且更接近于社会分层制度的是能力分班。本文即聚焦这种能力分组形式开展研究。

（一）起点公平：进入高成绩班级的机会研究

关于教育机会特别是起点公平的研究中，涌现了多种理论，描述了在社会分层和教育分层的背景下，家庭背景不利学生的教育机会获得问题。“最大化维持不平等”（Maximally Maintained Inequality，MMI）假设解释在教育机会增加的情况下，家庭阶层背景依旧会对子女的教育机会有强影响，因为扩大的教育机会将率先被高阶层父母获取，只有高阶层家庭的教育需求达到饱和，进而再扩大的机会才会被低阶层家庭获取（Raftery&Hout,1993）。“有效维持不平等”（Effectively Maintained Inequality，EMI）假设进一步认为，即使当教育机会多到社会各阶层都能受教育时，优质的教育机会也会优先满足高阶层家庭，从而与中低阶层家庭产生区分（Lucas, 2001）。也就是说，教育机会竞争门槛的降低并不必然带来教育机会在不同阶层成员中的平等分布，因为低门槛适用于所有人而非仅面向弱势家庭子女，优势家庭子女仍然可以凭借经济资源与社会文化地位优势获得更多且更优质的教育资源（刘铖&陈鹏,2023）。

很多实证研究也显示了学业成绩并不是能力分班的唯一依据，甚至并不是主要依据，工薪阶级背景的学生、少数族裔学生、低社会经济地位学生等弱势学生群体不成比例地被分配到低成绩班级（Boaler & William, 2001; Dunne et al., 2007, pp.21-26），有学者将这一特征称之为能力分班的“双重劣势”（Double Disadvantage）（Francis et al.,2017）。因此，能力分班反映的更多是社会结构而不是智力水平，并且成功或失败并不是随机的，而是与学生的背景存在密切的关联性（Hartas, 2018）。据此，本文提出以下研究假设：

研究假设1a 当家庭背景不同的学生的分班成绩均未达到进入高成绩班级的成绩标准时，相比于优势家庭学生，弱势家庭学生进入高成绩班级的机会更低。

研究假设1b 即使家庭背景不同的学生的分班成绩均达到了进入高成绩班级的成绩标准，相比于优势家庭学生，弱势家庭学生进入高成绩班级的机会也更低。

（二）结果公平：能力分班对于不同家庭背景学生成绩影响的研究

教育机会的结果公平通常指向不同类别学生学业表现的差异。能力水平不同的学生在不同成绩班级中是否有同样程度的成绩提高，是早期文献讨论能力分班结果公平的重点。研究普遍发现，能力分班对高成绩班级的学生具有积极效应，而对低成绩班级学生则有显著的负向效应，也就是说，能力分班对学生成绩的提高是以牺牲低成绩班级学生的学业发展为代价的，造成了严重的教育不公平（Kulik & Kulik, 1987; Lleras & Rnagel, 2009; Parsons & Hallam,2014;Preckel et al.,2019）。但在严格考虑能力分班内生性问题后，这种影响效应在新近的研究中是很小的（Betts,2011），比如基于严格随机实验设计的结果表明，高低学业表现学生均能够在能力分班中提升成绩（Duflo et al.,2011）。因为学生基线成绩也受家庭背景重要影响，上述研究也从一个侧面反映出家庭背景不同的学生在能力分班中的影响。

也有部分研究讨论了家庭背景不同的学生在能力分班中的表现。研究认为，能力分班对于改善弱势家庭学生的成绩表现更为有利，或仅对弱势家庭学生群体才发挥出显著的积极效用，缩小了教育不平等。卡德与朱利亚诺（Card&Giuliano, 2016）基于断点回归设计对城市学区小学生的能力分班成绩效应进行了研究，结果表明，进入高成绩班级就读对少数族裔（黑人和拉丁美洲人）学生有显著的影响效应，能够使得其在四年级的阅读和数学成绩上显著提高0.5 个标准差，这一效应在六年级依然显著。据此，本文提出以下研究假设：

研究假设2 进入高成绩班级对家庭背景不同的学生的学业成绩影响存在显著差异，弱势家庭学生能够从中获得显著的正向效应，优势家庭学生无法从中获得显著的学业提升。

（三）过程公平：能力分班对不同家庭背景学生成绩影响机制的相关研究

教育过程公平往往从教育内容、教育经费、教育设备以及师资水平等“投入性”角度，分析其对学生的不同影响（石艳&崔宇,2018）。但是，在探讨能力分班影响机制的相关实证研究文献中，这种“投入性”资源或“过程性”资源更多表现为班级同伴特征差异。

已有研究表明，班级同伴特征是解释能力分班对学生学业成绩影响效应的关键因素之一（Betts,2011;Abdulkadirolu et al.,2014）。某一位学生的成绩不仅依赖于其自身初始的能力，也会受到班级平均能力的影响，而同伴的平均成绩水平与个体学生的成绩获得存在显著的正向关系（Hoxby,2000）。一般而言，班级中拥有高学业成绩或高学习动机的同伴能够提高每一个人的学业成绩（Zimmer, 2003; Burke &Sass, 2013; Vardardottir, 2013）。但是，能力分班之后，学校将不同能力水平的学生区隔开来，实质上是对低学业成绩学生的一种损害。

同时，由能力分班造成的班级同伴质量差异对不同类型学生学业成绩影响具有明显异质性。尽管弱势家庭背景学生进入高成绩班级获得的同伴质量提升较优势家庭背景学生低，但是，弱势家庭背景学生却能够获得更高的成绩进步，也就是说，对于弱势家庭学生而言，能力分班的影响在很大程度上并不依赖于同伴质量，其在弱势家庭学生进入高成绩班级进而获得成绩提升中的解释力是非常有限的（Card& Giuliano, 2014）。基于精英学校的断点回归设计也发现，即使就读于精英学校的学生享受到更高水平的同伴质量，但是在大多数标准化测试成绩上并没有表现得更好，即便对于最高能力水平的学生而言，也没有显著影响，但是，却发现其对于少数族裔的学生有中等程度的影响效应（Abdulkadirolu et al.,2014）。

除了班级同伴质量外，班级同伴其他特征也备受学者关注，包括减少破坏性学生的比例（Lazear, 2001; Carrell & Hoekstra, 2010），或者更大的女性比例（Lavy&Schlosser,2011）。霍克斯比（Hoxby,2000）认为同伴效应除了与学业质量有关外，还可能与学生的残疾、种族和家庭收入有关。比如，对于高成绩表现的黑人学生的相关研究表明，较差的班级环境有可能会成为影响常规班级中少数族裔学生表现的阻碍因素，这些障碍可能包括较低的教师期望和频繁的校园欺凌（Fryer&Torelli,2010），但是在高成绩班级中会有所减少，甚至消失。卡德与朱利亚诺（Card&Giuliano,2016）发现高成绩班级的同伴特征有显著不同，比如同伴质量（提高）、同伴停学比例（下降）、同伴女性占比（提高）等。据此，本研究提出以下研究假设：

研究假设3 进入高成绩班级的弱势家庭学生，能够通过班级同伴特征的改善获得更高的学业成绩。

二、研究设计

（一）数据来源

本文使用的数据来自2020 年中部地区某市的一个区内所有15 所初中学校的样本，抽取七年级、八年级所有学生及其家长分别完成学生问卷和家长问卷共9,023 份。各学校校长填答校长问卷。学校还提供了学生在校期间参与的全区标准化测试成绩数据，包括学生初中入学摸底考试成绩、最近一次的全区期末统考的总分，以及语文、数学、英语学科成绩。

校长问卷结果显示，有7所初中校的校长提出，其所在学校基于学生入学测试成绩将学生分配到高成绩或低成绩两类班级。为了验证校长回答的真实性，我们将所有学校的数据分年级、分班级进行了入学考试成绩的分布比较，证实了7所学校开展能力分班的情况。图1举例展示了其中两所学校的情况。可以发现：图1a 和1b 的学生入学考试成绩明显地分成高低两类班级；图1c 和1d 的所有班级学生成绩则是相似的。

为了进一步讨论能力分班对弱势家庭学生的影响，本文后续分析主要基于7所实施能力分班学校内共计4,742 名学生的数据，这些学生分布于109个班级。家长问卷主要使用自我报告的家庭背景信息部分，并将其链接到学生。其中：高成绩班级学生2,012 名（42%），低成绩班级学生2,730名（58%）；七年级学生2,648名（56%），八年级学生2,094名（44%）①有1所初中校的八年级并没有实施能力分班，但是对于七年级新生实施了能力分班，本文保留了七年级新生样本，所以七年级的学生样本多了12%。；女生2,289 名（48%），男生2,453 名（52%）；平均年龄为13.64 岁；父母最高受教育程度为高中及以上的占比为41%；城镇户口的学生样本占比为49%。

（二）研究变量

本研究主要关注能力分班对弱势家庭学生的影响效应及其机制分析，弱势家庭学生指的是来自于底层贫穷家庭的学生（余秀兰&韩燕, 2018）。已有研究多从学生生源地（城乡）、家庭背景变量（父母职业声望、文化资本、经济资本）进行测量（谢爱磊等, 2018;李佳丽等, 2023）。其中，父母受教育程度，特别是母亲受教育程度，是学界公认的影响学业表现的最重要变量，因此本研究以父母最高受教育程度来测量学生家庭社会经济地位。学生的父母最高受教育程度若为初中及以下，则该学生被归为弱势家庭学生，父母最高受教育程度为高中及以上，则被归为优势家庭学生。其他研究变量见表1。

表1 变量描述情况（样本量=4,742）

（三）模糊断点回归设计

本研究是基于横截面数据开展的研究，对假设1 和假设2 进行验证时，面临能力分班变量的内生性问题。由于学生并非随机分配到不同类型班级，无法确定分配到高成绩班级学生的成绩变化，究竟是由能力分班直接所致，还是受一些尚未考虑到的学生个体或教师教学等混杂性因素影响，进而使得能力分班效应既有可能被夸大，也有可能被掩盖。这最终导致结果估计存在很大偏差（Betts,2011）。即使控制了学生的初始成绩、家庭社会经济地位之后也不能完全消除样本的选择性偏差（Pischke &Manning,2006）。因此，本文采用最接近随机控制实验设计的因果推断方法——断点回归设计，解决能力分班变量的内生性问题（Lee&Lemieux,2010），以验证假设1和假设2。

断点回归设计首要条件是确定合适的驱动变量（Running Variable）。本研究的驱动变量为学生入学摸底考试成绩。就读于能力分班学校的学生均在入学时参加了全区统一的标准化入学测试，学校主要依据测试总成绩（包含语文、数学和英语三科的总分，每科100 分制），将学生划分到高成绩班级或低成绩班级，即学生是否进入高成绩班级由某一个明确的分配规则（Assignment Rule）所决定。

断点回归设计还需要进行断点设置。断点分数主要用以确定学生进入高成绩班级就读的成绩标准，表明若学生入学测试总成绩超过这一标准则将其分配到高成绩班级，反之，低于这一标准则将其分配到低成绩班级。但是，学生的入学测试总成绩往往并不是决定学生是否能够分配到高成绩班级的唯一因素。学生小学阶段的成绩、小学教师对学生的评语信息、小学毕业校以及学生的家庭社会经济地位、是否是教职工子女等因素同样会在不同程度上影响其被分配到不同类型班级的可能性。这一点可以从图1a 的学生入学测试成绩的箱型分布图中得到验证，低成绩班级箱图的上须线与高成绩班级箱图的下须线并没有完全分割开来，而是存在部分区域的重叠，并且高成绩班级箱图还有部分低分异常值，也就是说虽然部分学生入学测试成绩较低，但是仍然被分配到高成绩班级。因此，根据数据的特点，本文使用模糊断点回归设计（Fuzzy Regression Discontinuity Design）。

对于断点（Cutoff Point）的设置，本文参考卡德与朱利亚诺（Card&Giuliano,2016）的方法，采用两步法：1）以最低分法获得初始断点分数，即高成绩班级学生的最低分作为初始断点分数；2）以最小化错分频率为目标不断调整初始断点分数，具体而言，在初始断点分数基础上持续提高1分，分别计算相应的错分频率①错分频率=（实际是高成绩班级学生按照分配规则被分配到低成绩班级学生人数+实际是低成绩班级学生按照分配规则被分配到高成绩班级学生人数）/学生总数。，取其最小值对应的更新后的断点分数作为最终分配标准。由于不同学校的生源数量和质量存在差异，用以分配不同层次班级的断点分数并不唯一，本文分学校、分年级计算断点分数，共有13 个断点，取值在185—247分之间。

参照格尔曼和伊本斯（Gelman & Imbens,2019）的推荐，为了减少因带宽扩大导致的系数估计偏差，实现真实平均处理效应的无偏估计（Lee&Lemieux,2010），本文使用局部线性非参数回归（Local Linear Nonparametric Regression，LLR）（Hahn et al., 2001）建构缩减模型（Reduced Form Equation），作为研究假设2判定的初步依据。模型构建如下：

其中：Ysgci指的是在s学校g年级c班级的学生i 的标准化测试总成绩；Csg是s 学校g 年级划分班级类型的成绩标准，即断点；Scoresgci是学生i入学摸底考试的原始成绩，即驱动变量；1{Scoresgci≥Csg}是示性函数（Indicator Function），即干预分配变量（Treatment Assignment Variable），当学生的入学成绩大于该校的成绩标准时赋值为“1”，否则为“0”，其对应系数β1表示预期能够进入高成绩班级学生的成绩效应，即意向性处理效应（Intent to Treat Effect）。同时在模型中加入中心化处理之后的驱动变量及其与干预分配变量的交互项，对断点两侧拟合值进行线性回归，并允许两侧直线斜率分别进行估计。由于断点分学校分年级设置，因而存在多个断点，为了提高统计效力（Statistical Power），本文将不同断点设置的学校年级样本进行了整合，并在模型中加入断点的虚拟变量ηsg。在不做特殊说明的情况下，在估计LLR 时，带宽皆使用均方偏误最优带宽（MSE），它是基于最小化均方误差获取的最优带宽，核函数使用推荐的三角核（Triangular Kernel）（Calonico et al.,2014），考虑到同一学校内部学生之间存在更大的相似性，系数标准误估计使用的是基于学校的聚类稳健标准误。

在模糊断点回归设计中，缩减模型无法精确获得学生实际进入高成绩班级对其成绩的平均处理效应，因此，本文在实证结果中同样展示以干预分配变量作为工具变量的两阶段最小二乘估计结果（Two Stage Least Squares Estimator，2SLS），模型建构如下：

模型2 是第一阶段回归（Treatment Equation，干预方程），表示预期进入高成绩班级的学生实际进入高成绩班级的条件概率，是判定研究假设1a 和1b 的主要依据。其中，Groupingsgci指学生i 实际接受干预的状态（Treatment Take-up），取值为“1”表示该学生被分配到高成绩班级，取值为“0”表示该学生被分配到低成绩班级。然后，将第一阶段回归的拟合值Grouping_estsgci带入模型3（Outcome Equation，结果方程），对应系数κ1就是学生实际进入高成绩班级对其成绩的加权的局部平均处理效应（Local Average Treatment Effects， LATE），是研究假设2 判定的主要依据。这里的权重反映学生i在临界值附近被分配到高成绩班级的概率（Lee&Lemieux,2010）。也就是说，这里估计的平均处理效应仅适用于服从者（Compliers），即当入学测试成绩超过断点分数，并进入高成绩班级就读的学生。模型的两阶段最小二乘回归（2SLS）采用结果方程的最优带宽，并将其作为干预方程的带宽，以保证两阶段回归使用相同学生样本（Imbens&Lemieux,2008;Imbens&Kalyanaraman,2012）。

（四）中介效应分析

接下来使用中介效应分析，对假设3进行检验。分析能力分班对弱势家庭学生标准化测试总成绩影响的中介效应大致分为两步。

第一步，估计预期进入高成绩班级对中介变量的因果效应值，即中介模型的a 系数估计，显著的a系数是判断有效中介机制的前提条件。本文利用模型1，以干预分配变量作为自变量，将结果变量替换成班级同伴特征指标（中介变量）获取a系数值。

第二步，在模型1的基础上，进一步控制中介变量，估计预期进入高成绩班级对弱势家庭学生标准化测试总成绩的直接效应值，建立如下模型：

其中，ω2系数值就是在控制了同伴特征（Yˉ-sgci）前提条件下，预期进入高成绩班级学生获得的净直接效应值，即中介模型中的c’系数的估计值，将c’系数值与模型1估计的总效应值β1（c）相比，就可以获得同伴特征变量在预期进入高成绩班级对弱势家庭学生成绩路径效应的解释比例［（c-c’）/c］。

三、结果分析

（一）断点回归连续性检验

断点回归最为关键的前提假设就是需要满足驱动变量在断点处的连续性（Lee, 2008）。也就是说，学生个体不能精确地操控驱动变量，在断点附近，样本的分配是随机的，不存在某一侧的样本点显著多于另一侧样本点的情况。只有满足驱动变量连续性假设，我们才能使用略低于临界值样本点的结果均值作为略高于临界点样本结果均值的反事实（Counterfactual Outcomes）。因此，在进行断点回归之前，我们需要检验该假设。

从现实情况来看，在实施能力分班的样本校中，入学测试之后才能获知分班的成绩标准，也就是说，学生根本不可能确切地知道划分高成绩班级与低成绩班级的临界值，因此对驱动变量的精确控制是不可能的。同时，该类考试通常与利益分配相关，属于高利害考试，这保证所有学生在参加入学测试和期末考试过程中都会非常认真。这些因素对于确保驱动变量的连续性假设提供支持。

从图形展示和假设检验结果来看，图2展示了驱动变量在高成绩班级和低成绩班级的概率密度函数图，可以发现它们在断点处的截距非常接近，而且95%置信区间也是重叠的，基本可以认为驱动变量在临界值附近是光滑的。进一步利用麦克拉里（McCrary,2008）方法对驱动变量的连续性假设进行检验，其原假设是驱动变量的概率密度函数在断点处是连续的，结果表明，对应的t值为0.32，p值为0.75，无法拒绝原假设，即认为驱动变量在断点处是连续的。

图2 驱动变量概率密度检验图

驱动变量的连续性假设表明所有可观察、不可观察的被试前定特征在断点处是相同分布的，即满足局部随机性（Lee & Lemieux,2010），因此，还需对可观察的前定解释变量在断点两侧的局部平衡性进行检验。从正式的缩减模型分析结果可以发现（见表2），在95%的置信区间中，所有前定解释变量在断点处的估计值均包含“0”，也就是说，并不存在显著的跳跃，满足局部随机性假设。

表2 前定解释变量局部平衡性检验表

（二）断点回归分析结果

图3展示了以标准化测试总成绩为因变量的最优带宽下（MSE）的第一阶段回归图示结果，使用的是局部线性非参数回归分别对临界值两侧的拟合值进行线性回归。图3a 是基于弱势家庭学生样本的第一阶段回归结果，图3b 是基于优势家庭学生样本的第一阶段回归结果。横坐标为中心化处理后的学生入学测试总成绩（即驱动变量），纵坐标为学生进入高成绩班级就读的概率值。从图3 中可以看出，不管是对于弱势家庭学生还是优势家庭学生样本而言，均存在明显的模糊断点，当学生入学测试总成绩恰好大于学校分班成绩标准时，学生被分配到高成绩班级的概率均有明显的跳跃。这与前文对于入学测试总成绩的箱型分布图（图1a）的分析是一致的，学生是否进入高成绩班级并不是由单一的入学测试总成绩决定的，仍然存在很多的“非服从者”，当其入学测试总成绩超过该校分班成绩标准时并未分配到高成绩班级，或者在相反的情况下被分配到高成绩班级。本文以最小化错分频率的断点设置在一定程度上降低了学生被错误分类的可能性，减少了非服从者。

图3 不同类型学生进入高成绩班级概率分布图

但不同的是，弱势家庭学生在断点处左临界值的概率值远远小于优势家庭学生，前者仅为29.49%，后者高达43.4%。这表明当学生的入学测试总成绩恰好均未达到学校分班成绩标准时（即断点），优势家庭学生拥有比弱势家庭学生更大的概率进入高成绩班级。而当学生的入学测试总成绩恰好均达到学校分班成绩标准时，弱势家庭学生进入高成绩班级的概率从原来的29.49%跳跃到64.28%，而优势家庭学生进入高成绩班级的概率从原来的43.40%跳跃到61.99%，前者提高了34.79%，后者仅提高了18.59%。也就是说，学生是否被分配到高成绩班级的参考标准对于断点附近学生而言存在较大差异。具体来说，当学生们均未达到学校分班成绩标准时，其是否进入高成绩班级在很大程度上受到优势家庭对分班程序介入或者学校对于优势家庭学生偏好的影响；相反，当学生们均达到学校分班成绩标准时，家庭背景并不构成影响学生是否进入高成绩班级的关键要素，弱势家庭学生和优势家庭学生进入高成绩班级的概率（64.28%和61.99%）并不存在明显差异，学生自身的学业成绩在分班程序中发挥更为关键的作用。但是，能力分班能够使学业表现相对较好的弱势家庭学生有更多的机会进入高成绩班级。也就是说，学校能力分班的机会公平是有条件的，即仅适用于学业表现优秀的弱势家庭学生，而非所有弱势家庭学生，而对于优势家庭学生而言，在进入高成绩班级机会的获取上，其家庭社会经济地位优势的身份标识远比其学业表现重要得多。研究假设1a得到证实，研究假设1b被推翻。

图4展示了中心化驱动变量与学生标准化测试总成绩基于缩减模型（模型1）的图示结果。图4a 是基于弱势家庭学生样本的意向性处理效应，图4b 是基于优势家庭学生样本的意向性处理效应。横坐标为中心化驱动变量，纵坐标为标准化测试总成绩。可以发现，弱势家庭学生的标准化测试总成绩在中心化驱动变量为0处（即断点处）存在清晰的跳跃，表明预期进入高成绩班级的弱势家庭学生能够显著地提高其学业总成绩。但是，对于优势家庭学生样本而言，断点两侧的拟合直线是光滑连续的，并不存在明显的跳跃，表明预期进入高成绩班级的优势家庭学生并未能获得学业总成绩的显著提升。研究假设2 得到初步证实。

图4 不同类型学生进入高成绩班级对标准化测试总成绩的影响分布图

表3综合展示了标准化测试总成绩的两阶段最小二乘估计结果。干预方程为基于模型2的进入高成绩班级概率估计结果（γ1），结果方程为基于模型3的局部平均处理效应估计结果（κ1）。模型1 和模型2 是基于弱势家庭学生样本的估计结果，模型3 和模型4 是基于优势家庭学生样本的估计结果。

表3 不同类型学生样本的模糊断点回归结果

模型1 和模型3 仅控制了学校和年级固定效应项（即断点虚拟变量）。干预方程结果显示，当弱势家庭学生入学测试总成绩恰好超过该校分班成绩标准时，其进入高成绩班级的概率显著高出34%，而对于优势家庭学生而言，进入高成绩班级的概率显著高出19%。即使在模型中进一步纳入学生控制变量（性别、年龄以及户口类型）（模型2 和模型4），相应系数值和标准误并没有发生明显变化，这可以进一步减少对于错误界定学校年级断点的担忧。结果方程显示，恰好进入高成绩班级的弱势家庭学生，相比于刚好未进入高成绩班级的弱势家庭学生，其标准化测试总成绩显著提高0.38个标准差，而对于优势家庭学生而言，进入高成绩班级对其标准化测试总成绩并不存在显著的影响效应。在进一步考虑到学生控制变量的情况下（模型2和模型4），局部平均处理效应的系数和显著性程度并没有发生较大变化，结论具有稳健性。研究假设2得到证实。

（三）断点回归分析的稳健性检验

为了进一步验证和确认断点回归结果的可靠性和稳定性，本文采用了四种策略对模糊断点回归结果进行了必要的稳健性检验，包括采用不同的带宽、按新标准分类、重新选择效标变量以及学校样本的异质性分析。

首先，重新设定最优带宽，重新估计两阶段最小二乘模型，将其与表3 结果进行对比，看两种方法结果是否存在明显变化。表4展示了基于覆盖偏误概率（Coverage Error Rate，CER）最优带宽的估计结果，不同于均方偏误最优带宽（MSE），它是以实现覆盖偏误概率最小化为标准进行带宽的最优选择（黄斌等,2022,p.314）。可以发现，相比于MSE 最优带宽，CER最优带宽更窄，纳入模型分析的样本量更少，但是估计的干预方程和结果方程结果与表3 具有一致性，并没有发生明显的变化。这表明模糊断点回归结果对于带宽的选择并不敏感，具有较高的稳健性。

表4 基于CER最优带宽的估计结果

其次，重新界定弱势家庭学生，将户口类型为农村的学生界定为弱势家庭学生，户口类型为城镇的学生界定为优势家庭学生，重新估计两阶段最小二乘模型，与表3结果对比，观察两种结果是否存在明显变化。表5展示了基于户口类型界定弱势家庭学生的估计结果，可以发现，干预方程与模型3的估计结果基本一致，结果方程中弱势家庭学生的局部平均处理效应系数值小于表3的估计结果，但是同样表现为显著的正向效用，对于优势家庭学生的估计结果仍然不存在显著的影响效应。研究结论并不受弱势家庭群体错误识别的偏误影响，具有较高的稳健性。

表5 基于户口类型界定弱势家庭学生的估计结果

再次，重新选择效标变量，利用学生期末统考分科成绩作为结果变量，重新估计两阶段最小二乘模型，将其与表3结果对比，观察二者是否存在明显变化。表6分别展示了以学生语文、数学以及英语学科成绩作为结果变量的估计结果，可以发现，不同学科成绩的干预方程与模型3的估计结果基本一致，结果方程中弱势家庭学生局部平均处理效应在数学和英语学科中仍然发挥显著的积极效应，进入高成绩班级对于弱势家庭学生语文成绩并不具有显著的影响效应，这与已有的相关实证研究具有一致性（Ireson et al., 2002; Matthews et al.,2013）。而对于优势家庭学生而言，进入高成绩班级对其三科分科成绩均不存在显著的影响效应，结果与表3具有一致性。

表6 以期末分科成绩为结果变量的估计结果

最后，基于学校统测的学生入学摸底考试成绩平均值将学校分为优质学校（总分平均值大于样本均值207 分，共3 所学校）和薄弱学校（总分平均值小于样本均值207 分，共4 所学校），分样本重新估计两阶段最小二乘模型，将其与表3结果对比，观察二者是否存在明显变化。表7 展示了这一结果，可以发现，不管是对于优质学校还是薄弱学校而言，弱势家庭学生的干预方程和结果方程估计结果与表3基本一致，而优质学校优势家庭学生的干预方程估计结果虽然系数值与表3 结果较为一致，但不再具有统计显著性，很大原因是受样本量减少导致标准误增大所致；薄弱学校优势家庭学生的干预方程和结果方程估计结果也与表3具有一致性。综上，断点回归分析的研究结论是稳健的，假设1a 和假设2 结论是可靠的。

表7 学校类型的异质性估计结果

（四）中介效应分析结果

为了解释弱势家庭学生进入高成绩班级后，其学业成绩的影响机制，本研究分两步开展了中介效应分析。第一步，估计弱势家庭学生预期进入高成绩班级对班级同伴特征（中介变量）的因果效应值，即对a系数的估计，表8第二列展示了这一结果。可以发现，相比于未进入高成绩班级的弱势家庭学生，进入高成绩班级的弱势家庭学生不但可以获得更高质量（a系数为0.42）、更具优势地位的同伴（a系数为0.04），同时面临校园欺凌的风险也大大降低（a 系数为-0.04），这些班级同伴特征的改善在一定程度上可能形成其实现成绩提升的有效路径。而进入高成绩班级的弱势家庭学生在同伴女性占比以及同伴家校合作水平上与未进入高成绩班级的弱势家庭学生并没有存在显著差异。

表8 样本为弱势家庭学生的中介模型估计结果

第二步，在控制班级同伴特征前提条件下，估计预期进入高成绩班级对弱势家庭学生标准化测试总成绩的因果效应值，即对c’系数的估计，表8 第三列展示了这一结果。其中，无中介变量行是基于模型1估计的进入高成绩班级的成绩效应值（β1），没有纳入任何班级同伴特征变量，作为初始模型；其余所有行表示仅纳入单一对应同伴特征指标下的成绩效应值（ω2）。可以发现，同伴质量、同伴的高学历家长占比、同伴校园欺凌比例以及同伴家校合作水平分别能够完全或部分解释弱势家庭学生进入高成绩班级的成绩效应。具体而言，同伴质量能够解释总效应的38.46%[(0.13-0.08)/0.13=0.3846]，其余有效的中介变量均能够解释总效应的7.69%[(0.13-0.12)/0.13=0.0769]，而班级女性占比、班级城镇户口占比对总效应均无解释力。结合a 系数估计结果，可以发现，弱势家庭学生进入高成绩班级获得成绩提升主要得益于高质量的班级同伴，同时，更具优势地位的班级同伴、校园欺凌风险的降低对其成绩提升也发挥着一定的中介作用。研究假设3 得到证实。

四、结论与讨论

本文回应了在能力分班条件下，弱势家庭学生的机会公平问题，使用模糊断点回归设计研究了进入高成绩班级对弱势家庭学生学业成绩的影响，并探究了其中介效应机制。总体来说，对于弱势家庭学生而言，能力分班这种教育分层制度回应了机会公平的目标，具有较高效能，但仍然存在不公平隐忧。

（一）分层制度未阻碍成绩好的弱势家庭学生的教育流动，但仍有效维持不平等

从起点公平角度来看，本研究证实了假设1a，即当未达到学校分班成绩标准时，学生能否进入高成绩班级在很大程度上受到优势家庭对分班程序介入或者学校对于优势家庭学生偏好的影响，弱势家庭学生（父母最高受教育水平为初中及以下或学生户口为农村）进入高成绩班级的机会更低。同时，推翻假设1b，即当家庭背景不同的学生均达到学校分班成绩标准时，相比于优势家庭学生（父母最高受教育水平为高中及以上或学生户口为城镇），弱势家庭学生更有机会进入高成绩班级。

推翻假设1b 的结论驳斥了已有研究中能力分班反对者认为能力分班是一项不公平的教学组织形式的观点（Argys et al., 1996; Oakes,2005,p.13），与已有对于其他弱势学生群体特征的相关研究具有一致性（Abdulkadirolu et al., 2014; Card & Giuliano, 2016）。数据表明，能力分班并不是教育再生产的机制，更可能是一种实现弱势家庭学生向上教育流动的可行路径，起码基于我国能力分班实践是如此的。但数据同时解释了能力分班制度所显示机会公平的条件性，即仅适用于学业表现优秀的弱势家庭学生，而非所有弱势家庭学生。从教育特别是教育流动对社会的价值而言，能力分班这种分层制度是完全可以实现“寒门贵子”这一隐喻的。哈佛历史学家弗雷德里克·杰克逊·特纳提出，高社会流动性是理想的无阶级社会。而在阶级界限没有开放的情况下，教育则是作为流动的、无阶级社会所需要的流动性工具（桑德尔,2021,p.177）。能力分班这种分层筛选制度，虽然将学生分为不同层级，复制了社会分层结构，但该制度并没有阻碍层级之间的流动，有助于实现起点公平。

假设1a 被证实，说明有效维持不平等假设依然成立。研究发现成绩未达到分班界限分数时，优势家庭学生可能有更多机会进入高成绩班级。这一结果并未显示出弱势家庭学生的机会优势，结合假设1b 来看，教育阶层上升的通道仅仅为那些成绩突出的弱势家庭学生打开，仍然维持了家庭社会经济地位所带来的不平等，阶层固化的隐忧仍然存在。在教育高质量发展阶段，受教育机会普遍增加，已经能够满足绝大多数人的需求，但优质教育机会仍然稀缺，成为竞争的主要目标。能力分班这种分层制度下，高成绩班级暗含了优质教育机会，从资源分配角度来看，优势家庭仍然可以突破制度安排，获得更多优质教育机会。

（二）分层制度构筑隔绝不利的“玻璃墙”，但本质仍为“隔离但平等”

从过程公平角度来看，本研究证实了假设3，即进入高成绩班级学生主要通过同伴质量的提升而显著提高自身的总成绩表现。相比于优势家庭学生，弱势家庭学生通过进入高成绩班级获得显著成绩提升的主要原因仍然是同伴质量，通过与高能力水平同伴的交流互动可以显著提高弱势家庭学生的学业成绩。对于弱势家庭学生而言，班级平均家庭社会经济地位的提升、班级校园欺凌的减少均能够部分解释恰好进入高成绩班级的学生的学业提升。通常而言，弱势家庭学生面临成绩失败的风险和不利学习的条件更多，而能力分班作为一种筛选制度，在高成绩班级塑造了同质性的高成绩同伴，并为其提供了有利学习的环境和条件。

能力分班通过学业表现的简单划分和隔离的方式，有意制造了学生层级之间的区隔，低成本开展机会公平实践。这种隔离客观上为弱势家庭学生塑造了更好的学习环境，隔绝了弱势群体环境中的不利条件（Fryer & Torelli,2010），为弱势家庭学生筑起隔绝环境的“玻璃墙”，使其免遭校园欺凌，享受高质量同伴所带来的正向效应，解释了弱势家庭学生向上教育流动的可能机理。从这一角度来看，制度是有效的。结合假设1来看，能力分班使得学业成绩优异的弱势家庭学生能够获得更多的机会进入高成绩班级，从而获得更好的班级环境和氛围、更高质量的同伴和教学以实现其学业成绩的提高。因此，能力分班不仅是实现弱势家庭学生教育补偿的有效机制，同时也是助推弱势家庭学生向上教育流动的重要手段，甚至是一种低成本的机会公平制度。

但从分层制度的本质上看，能力分班是典型的“隔离但平等”（Separate but Equal）制度，相互隔离制度设计本身就是不平等。机会公平往往遵循政治逻辑（程红艳& 罗艳华,2023），而制度本身最根本的教育逻辑被忽略。能力分班所做的制度性隔离，导致处于高成绩班级或学业顶端的学生陷入焦虑，也让筛选到低成绩班级的学生陷入沮丧甚至体验羞辱性的失败感。隔离引发对顶端和底端群体的“双向暴政”，制度对正义越敏感就越不宽容失败。向上和向下两个方向的“暴政”的道德来源是，我们作为个人，对自己的命运负有全部责任（桑德尔,2021,p.204）。而这种分层的筛选越严格，其伦理基础就越靠不住。当外部制度被认为是正义的，人们的失败只能归咎于自我。但实际上，这种失败与否本身就是制度带来的，消除此类制度就不存在所谓“失败”的概念，而这一制度是否是合理的，相关论证是不充分的。而当一个制度给孩子打上“失败”的标签后，这样的制度越公平，或者能力筛选越敏感，导致孩子遭受时刻有可能失败的威胁时，其教育性越缺失。对正义越敏感的制度就越不宽容，越违背了教育尊重和鼓励人发展的本质。

（三）分层制度促进弱势家庭学生成绩提升，但仍存在“阶层固化”隐忧

从结果公平角度看，本研究证实了假设2。结果显示，弱势家庭学生能够通过进入高成绩班级，使得总成绩显著提高0.38个标准差。而对于优势家庭学生而言，是否进入高成绩班级对其成绩表现的影响非常小，这一结论在不同学科的表现中均具有一致性。

从理论逻辑上来说，能力分班并不是一个有碍结果公平的制度，恰恰相反，通过开展针对不同类型学生的适应性教学，从而保障每一个学生都能够获得实质性的发展和成长，是公平最终的理论关怀，也是缩小学生成绩差距的一个有效的、相对来说低成本的工具（Robinson,2008）。基于严格因果推断的相关研究也表明，能力分班的实施并没有牺牲低成绩班级学生利益，不同成绩班级类型的学生都能够从中获益（Figlio & Page, 2002; Duflo et al.,2011）。进一步的研究表明，进入高成绩班级对于弱势家庭学生的成绩表现更为有利或仅对弱势家庭学生群体才发挥出显著的积极效用（Zimmer,2003;Card&Giuliano,2016），这与本研究结论一致。

但从分层制度的累积效应来看，阶层固化的问题仍然未被避免，制度疏密问题值得讨论。本研究只揭示了能力分班作为教育体系中首次出现的分层制度，缺乏多重制度的综合性累积，无法全面说明教育分层制度的实际效果。特别是目前分层制度中存在多类型实践，包括动态分层教学、交叉分层教学、精准分层教学等（昌晓莉& 孔卫平, 2008; 王永雄等,2017），其所表现出的制度疏密是不同的。但大量证据表明，不同成绩班级学生之间是很少流动的（Dunne et al.,2011），早期能力分班信息往往决定了学生以后的班级类型（Gamoran,1992），这种静态能力分班会导致早期劣势的固化，进一步加剧不同能力学生之间成绩的差距。这种差距不仅体现在短暂的学期或学年阶段中，同时也会作用于未来劳动力市场结果，导致他们在成年之后更低的收入，从而扩大经济不平等，固化代际之间的经济劣势，成为教育再生产的关键机制（Oakes, 1990;Glass, 2002; Betts, 2011）。分层制度如何考虑打破优绩至上的机会公平观念，引入教育本质的、道德的、公共利益的价值，仍需要再讨论。

此外，本文仅基于单一行政区域开展研究，研究的样本选择和规模受到较大的限制，相关研究结果是否能够推广尚且存疑。然而，目前大量基于能力分班效用的研究主要集中于西方教育情境，作为一个拥有1.54亿名义务教育阶段在校生的教育大国，分层制度普遍存在，尤其是阶层固化隐忧依然存在的情况下，如何守住教育公平的国本，巩固国家对于教育公平的艰巨努力成果，推进教育高质量发展值得进一步关注。

能力分班对寒门学子有利吗？——机会公平视角下教育分层制度的效能与隐忧