教育数据思维应用的五大陷阱

2024-04-14 18:19钟志贤胡飞张义
中小学数字化教学 2024年3期
关键词:陷阱

钟志贤 胡飞 张义

摘要: 教育数据思维是大数据思维在教育领域的应用和体现,是智能时代教育教学中的重要认知和决策方式,更是当下教育数字化转型之关键“转思维”的重要内容。诚然,教育数据思维具有多元价值意义,也在大数据思维的时代潮流下获得了广泛的拥趸。但是,如同大数据对我们的世界观、认识论、方法论、价值观和伦理观带来深刻变革的同时也带来严峻挑战一样,教育数据思维的应用也可能存在认知误区和陷阱。研究在理解教育數据思维内涵的基础上,结合教育数据思维的应用场景,认为教育数据思维的应用存在五大陷阱,即数据主义、全数据模式、数据投喂、算法偏见、数据伦理危机。

关键词:教育数据思维;陷阱;教育数字化转型;算法偏见;数据伦理危机

智能技术的发展推动了各行业、各领域的转型与变革,重塑了当今世界的教育生态,以大数据、人工智能、元宇宙等为代表的第四次科技革命为教育数字化转型提供了发展契机与技术条件。数据和数据思维是数字化转型的核心要素和关键思维模型。同样,数据也是教育数字化转型的核心驱动力,作为教育数字化转型主体必备的思维方式——教育数据思维(educational data thinking),目前已在数据驱动的教学、教育数据治理、精准学习分析与评价、优化教育决策等方面得到广泛应用,如利用教育数据对学生的学业表现或能力进行描述性、诊断性、预测性分析,构建学习者知识、行为、体验等模型以对其进行精准画像,并开展自适应和个性化教学等。然而,在教育数据思维的认知与应用中存在诸如数据主义、算法偏见等误区或陷阱。因此,充分理解教育数据思维可能存在的显性或隐性陷阱,有利于推动教育数字化转型向纵深发展。

一、理解教育数据思维

教育数据思维,是数据、教育数据、思维和数据思维几者的合成概念,是数据思维在教育认知和决策中的应用。

(一)思维与数据思维

思维是人类特有的一种高级认识活动,旨在探索与发现事物的本质联系与发展规律,是人类认识客观世界的高阶能力。所有人的思维都深受环境和时代等因素的影响。自大数据作为思维运行的要素以来,人们对数据思维进行了多维多面的认识。

数据思维是一种问题求解和创新能力。数据认知素养之父莫罗曾说,数据思维是数字时代人类听、说、读、写之后的第五种基本生存技能。数据思维从本质上来讲,是人类利用数据创造价值的一种思维能力[1],它涉及数据的采集、数据关联分析、用户画像以及预测等能力[2]。数据思维是人们在数据基础上获得新知和创新的源泉。

数据思维是一种思维过程。它以人们获得的数据为基础,通过数据挖掘和数据分析(包括分析、比较、综合、抽象和概括,形成概念、推理和判断等系列思维过程),使人们对客观事物的认知由经验判断转为数据驱动,由直观感性转变为客观理性的一种思维过程。

(二)教育数据思维

1.教育数据思维的内涵

我们认为,教育数据思维是指基于教育数据识别、理解、分析和解决教育问题的认知与决策方式,其本质是教育主体利用教育数据创造价值的一种高阶思维能力。教育数据思维是强调教育数据视角下的思维,是指运用数据科学、统计学相关知识,对教育数据进行处理、分析、评价、创新,并形成解决问题思路与方法的思维活动[3]

教育数据思维既是一种能力,也是一种思维倾向,具有四个明显特征:关联性思考、基于数据的决策、数据结果的辩证审视及数据的价值创造[4]。关联性思考是指通过对数据的处理与分析,思考学习者的学习结果与学习内容、学习资源与教学行为等变量间的相关关系[5]。基于数据的决策是让客观数据在教育决策中“说话”。辩证审视数据结果是指用辩证批判的思维判读与应用数据,体现人的智慧,不被数据所宰制。数据的价值创造是指利用教育数据创新性地解决现实教育问题,让教师有机会通过数据深度观察自身的教学行为和每位学生的真实状态[6]

2.教育数据思维的构成

教育数据思维的主要构成是什么?在公共治理体系中的数据思维,主要包括服务性思维、时效性思维、共享性思维和开放性思维[7]。大数据促进了人类思维方式的转变,主要体现为总体思维、容错思维、相关思维和智能思维[8]。而教育数据思维主要由数据量化思维、数据关联思维、数据驱动思维及数据反馈思维构成[9]

数据量化思维是指“用数据说话”的思维能力[10],以及对教育教学行为进行量化分析的一种思维模式。大数据时代,从原来追问“为什么”到现在关注“是什么”,相关关系逐渐替代因果关系[11],即从因果思维转向关联思维。数据关联思维的核心是量化两个数据之间的数理关系,通过数据间的相关关系预测走势。数据驱动思维是指基于数据进行的各种教育决策、管理、评价,如精准教学、教育治理和教育系统的变革与创新。数据反馈思维是指将数据分析结果用于教育教学干预决策,或将数据反馈给学生,使学生成为教育数据的主宰者、教育状态的调控者,充分发挥学生的主观能动性,促进其自我认知与学习能力的提升[12]

3.教育数据思维的价值

如同数据思维具有多方面的价值一样,教育数据思维也不是简单的思维模式,而是教育主体利用数据推动教育教学创新发展的高阶思维能力,具有强烈的时代感和现实需求。它是开展数据驱动教育教学范式发展的基础,是教育主体数据素养或数字素养培养的重要内容,更是研究型教师在数智时代必备的思维方式。随着教育信息化2.0行动计划的实施,研究型教师逐渐成为中小学教师的一个重要发展方向[13]。这意味着教师要会利用数据开展教学和科学研究,会分析挖掘相关教育数据,进而解决相关教育教学问题。在数据驱动的精准教学新时期,教育数据思维将不再是数据分析师特有的能力,而是每一位研究型教师都应该具备的。

二、教育数据思维的五大陷阱

任何事物都有两面性,教育数据思维亦如此。思维陷阱,又叫“认知扭曲”,指的是一种非理性的思维模式。思维陷阱会严重阻碍人们对现实世界的清醒认知,使人们陷入局限且无效的思考,做出错误的决策[14]。教育数据思维在助力教育变革的同时,也可能使人们的教育认知或决策落入思维陷阱,如数据主义、全数据模式、数据投喂、算法偏见等。

(一)数据主义(dataism)

数据主义,简单来说就是一切以数据为先,一切让数据说了算。数据主义者认为世界的一切关系皆可以用数据来表征,世界的本质就是数据,因而世界由哲学意义上的物质和精神关系,变成了物质、精神和数据的关系。数据崇拜是数据主义的极端表现,主要体现为对数据的极度信任、崇拜,甚至痴迷,以致《未来简史》的作者尤瓦尔·赫拉利称之为新兴宗教,认为它“崇拜的既不是神也不是人,而是数据”[15]。许多人痴迷于大数据预测未来的能力,从而被推向数据万能论。

但人类的精神世界能完全被数据化吗?答案是否定的。数据主义过分强调数据的技术及工具理性,忽视了教育教学过程的价值理性,而超越教育的人文特质、内在心理和情感意识等很难用数据进行量化和表征。

数据思维能促进教师的思维方式由经验主义向数据主义转变。教育中的数据主义主要表现为定量导向的教育评估方式、数据至上的教育思维模式及算法驱动的教育决策范式[16]。在教育数字化转型向纵深推进的背景下,量化数据固然增强了教学预测的准确性、教育决策的科学性,但同时产生的负面影响是教师更加依赖数据,好像脱离了数据支撑,一切都缺乏说服力。也就是说,在教育教学中适度应用数据无疑是有利于教学活动的,但倘若教师过度坚持数据主义,则只会模糊或缩小其视界,甚至有可能成为数据的奴隶。例如,在基于证据的教学中,绝对信奉数据必然会严重影响教师的认知和判断,对教学和学生形成刻板印象[17]。因为其获取的数据不一定是完全精确的,且数据往往只能简单反映某种结果或事实,却不能做归因分析,更存在数据权益、数据隐私、人性自由的伦理与责任问题和信息安全风险。

(二)全数据模式(full data mode)

全数据模式,是指人们对相关数据的获取不再仅限于样本数据,而是全部数据。数据规模的“大”与“小”,通常被认为关乎数据分析结论的准确性。大数据会克服小数据在随机采样中存在的偏见,能够从不同角度、更细致地观察和研究數据的方方面面。因此,人们通常认为小数据的思维具有较强的主观性、随机性和不确定性,大数据的思维则更加快速、科学和高效。

但过于强调数据的“大”与“小”会造成大数据与小数据的对立,忽略两者的相对性和包容性。我们要认识到,所谓“全数据模式”只是一种理想化描述,大数据和小数据是一对互为映射的概念,数据的价值并不取决于它规模的大小,分析大数据必须以小数据为基础。再者,数据和信息是瞬息万变的,无论技术发展如何之快,也无法跟上数据变更的速度。因此,教师得到的“全部数据”是具有历史性和迟滞性特征的。全数据模式的“全”强调数据量庞大,还可能落入“大而不全”的陷阱中,数据的完整性和全面性等维度还有所欠缺。比如,教师掌握最多的是学生历次考试的成绩数据,若将其作为评判学生的重要标准,缺乏对学生生活、心理等方面数据的掌握,则无法实现对学生全维度、全过程、全场景的数据分析。这不仅会影响教师对学生的教育评价,还会干扰教师的教学决策。

(三)数据投喂(data feeding)

数据投喂,是指数据主体被动接受外界投送的数据,主要表现为数据主体在面对数据时不主动思考,不推理和质疑,只被动接受大数据算法的“投喂”。

教育领域的数据投喂现象不胜枚举。例如,某些教学辅助软件或学习软件会让师生进行兴趣选择并填写相关信息,然后通过算法精准推送迎合师生兴趣的某方面内容,实施精准的数据投喂。这看起来是一种高效的学习方式,实则可能严重限制其认知发展和认知自由。又如,教师通过获得学生的考试成绩来判定学生学习水平的高低,但考试成绩并不能完全代表学生的真实水平。学生考试时的状态、外界环境的干扰等因素都会影响其成绩表现。另外,教育大数据因其庞大体量和惊人增速,难以逐一验证,其中不免存在虚假不实的教育数据,教师在未加辨识的情况下很可能被投喂错误的教育数据。

数据投喂的危害极大。作为主体的人类已被裹挟进了云计算、大数据、物联网、移动互联网、人工智能等技术框架之中。但是人类在享用技术革新带来的便利的同时,也被智能算法推荐投喂,使得“信息茧房”“回音壁”“井蛙共振”等效应频发,乃至形成“网络巴尔干”或圈层固化等现象,甚至成为“缸中之脑”。对于教师而言,被投喂的教育数据是真实的还是虚假的,数据是否准确可靠都不得而知,有数据不一定就有真相。此外,杂乱无章的数据极有可能造成数据混沌化,导致数据整合困难和解释缺信。作为教育数据应用的主体,教师如果过于依赖数据投喂,可能导致其主观判断力、问题洞察力、教学创造力持续弱化,产生视野狭窄、认知受限、偏见严重等不良后果。

(四)算法偏见(algorithmic bias)

算法偏见,是指算法程序在信息生产与分发过程中失去客观中立的立场,造成片面或者与客观实际不符的信息、观念传播,影响公众对信息的客观全面认知。人类进入了一个数据可以对人类进行算计的时代。数据驱动的计算容易使人陷入数据算计与算法偏见的泥沼。大数据自身存在的片面性可能导致教育大数据和教育人工智能应用先行就嵌入了无意或未知的偏见,数据偏差必然产生算法系统推荐的偏见。历史数据的偏见、数据采集不充分和数据集特征选取不当都会落入算法偏见的陷阱。当主观的算法偏见渗透于教师的教育教学和管理过程,教师的教育决策质量就会降低,导致学生受到不公正对待[18]

首先,数据平台一边记录学生的学习数据,一边为每个学生贴上标签,且这些标签会跟随学生档案一直存在。这些数据标签对学生进行简单粗暴的定义,聚焦和放大学生的缺点与不足,无疑会对学生成长产生负面影响。其次,数据驱动和算法预测只能得到学生学习行为的倾向,并不能准确反映学生的所思所想,且在一定程度上束缚了学生意愿、限制了学生自由。“精准”不等同于“个性”。海量的教育数据正在以指数式快速增长,数据驱动所产生的结果只是其中的一种可能,并非唯一标准和最终答案。数据提供了扩展思维的空间,从多角度、多层面思考问题,也要求人们解放思想,不断吸收新的信息,从而形成新的思路和方法[19]。教师若不能在教育过程中理性审视数据驱动带来的弊端,必将深陷算法偏见的泥潭。若要合理规避数据算计和算法偏见,教师应改进升级教育数据的收集方式、代表性和质量,精确收集当前数据,合理矫正历史数据;遵从教育公平公正原则,制定清晰的算法评估标准[20]

(五)数据伦理危机(data ethics)

数据伦理,是指对数据生产、治理、使用和共享过程中个人和机构需要遵守的社会道德和科学规范,是数据从业人员和机构应该遵从的职业道德准则。但个人的有限理性、数据权力的形成以及规约机制的滞后等因素致使数据伦理危机的产生,主要表现为:数据滥用和违规共享侵犯用户隐私、数据霸权催生数据垄断、数字身份陷入伦理困境、数据叠加算法支配个人、数据作假引发信任危机、数字鸿沟加剧社会不公等。例如,数据的“谁收集谁拥有”“谁投资谁拥有”“谁控制谁拥有”的丛林法则形成了数据壟断和“跑马圈地”格局[21],甚至会引发数据霸权现象。

在教育领域,互联网使教师可以获取大量教育教学数据,但同时也引发了数据隐私和安全等问题。首先,学生的各种数据都被记录,教室和校园无处不在的监控设备记录学生的一言一行,使学生完全处在“第三只眼”的监视之下。在一个几乎完全透明的环境中学习和生活,学生丧失了自我空间,自身隐私无法得到保障。其次,国内缺乏关于教育数据隐私泄漏影响评估的研究,教育数据采集与共享的合法范围未加明确,监管制度并不完善,容易深陷教育数据伦理与安全的漩涡。比如在过程性评价中,学生通常对智能设备、视频录制、线上平台等渠道收集自身的教育数据缺乏知情权,学生不知道自己的哪些数据会被收集、数据将作何用途;在总结性评价中,在试卷的批改、成绩的录入等过程可能存在人为篡改数据的伦理问题。在教育数据管理上,由于管理的纰漏或管理人员道德伦理的丧失,可能导致师生的教育数据和敏感信息遭受泄露和贩卖的风险。在数据分析过程中,算法分析的局限性及“算法黑箱”等问题可能造成技术偏见等伦理问题。学生作为教育数据的主要来源,对其自身数据隐私的知情权和控制权可能受损。

三、结语

数智时代,教育走向数据思维是不可逆的,师生或教育管理者必然要学会与教育数据思维共生共存。上述教育数据思维应用的陷阱可能是显性的,也可能是隐性的。为避免教育数据思维应用陷阱,首先,我们应树立正确的教育数据使用意识和使用动机,这是合理利用教育数据的前提,也是发挥教育数据效用的理念引领与价值导向;其次,在坚持教育数据技术理性的基础上,要融入人文精神以弥补数据主义盛行下人文主义的缺失,使技术理性与价值理性和合共存,切实把握教育数据蕴含的机遇;最后,要培养良好的教育数据思维,如培育教育数据理念、提升数据处理技能、洞察数据与教学的联系、研判教育教学问题、培养数据批判精神和创新教育教学模式[22]。当然,最有效的方式是从游泳中学习游泳,因此教师要对数据的应用积极实践,不断地利用数据识别、理解、分析和解决教育教学问题。

教育数据思维本质上来说是人机协同的思维,使用中应确保人类“数字主体性”作用机制,如数字自信、数字胜任力、数字问责和数据正义等,确保由人类控制和使用数据思维来为教育教学服务,如诊断问题、复刻现实、精准教学、学情分析、教学决策和教育治理,等等。例如,今天每个人都是主动或被动的数据制造者,数据足迹实时采集、无处不在,但数据的意义判读取决于数据主体的数字素养。

参考文献

[1] JIMERSON J B. Thinking about data: Exploring the development of mental models for “data use” among teachers and school leaders[J]. Studies in Educational Evaluation,2014(42):5-14.

[2] 赵晋,张建军,王奕俊.大数据思维下教育发展机遇与挑战的再思考[J].电化教育研究,2018(6):21-26.

[3] 李新,杨现民.教育数据思维的内涵、构成与培养路径[J].现代远程教育研究,2019(6):61-67.

[4][9][22]杨现民,李新.中小学教师数据素养[M].北京:科学出版社,2021:203-210.

[5] 徐鹏,王以宁,刘艳华,等.大数据视角分析学习变革 :美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.

[6] 刘三女牙,杨宗凯,李卿.教育数据伦理:大数据时代教育的新挑战[J].教育研究,2017(4):15-20.

[7] 高奇琦,陈建林.大数据公共治理:思维、构成与操作化[J].人文杂志,2016(6):103-111.

[8] 张义祯.大数据带来的四种思维[N].学习时报,2015-01-26.

[10]刁生富,姚志颖.论大数据思维的局限性及其超越[J].自然辩证法研究,2017(5):87-91.

[11]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代 :生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:25-34.

[12]胡水星.教师TPACK专业发展研究:基于教育大数据的视角[J].教育研究,2016(5):110-116.

[13]雷朝滋.教育信息化:从1.0走向2.0:新时代我国教育信息化发展的走向与思路[J].华东师范大学学报(教育科学版),2018(1):98-103.

[14]斯科特·亚当斯.跳出你的思维陷阱[M].杨清波,译.北京:中信出版集团,2021.

[15]尤瓦尔·赫拉利.未来简史[M].林俊宏,译.北京:中信出版集团,2017:335-340.

[16]王正青,但金凤.教育中数据主义的生成逻辑与双重效应[J].教育科学,2022(5):31-39.

[17]张韵.“互联网+”时代的新型学习方式[J].中國电化教育, 2017(1):50-57.

[18]王佑镁,王旦,王海洁,等.算法公平:教育人工智能算法偏见的逻辑与治理[J].开放教育研究,2023(5):37-46.

[19]张燕南,赵中建.大数据时代思维方式对教育的启示[J].教育发展研究,2013(21):1-5.

[20]ZEIDE E. Artificial Intelligence in Higher Education: Applications, Promise and Perils, and Ethical Questions[J]. Educause Review,2019(3):31-39.

[21]翟云,蒋敏娟,王伟玲.中国数字化转型的理论阐释与运行机制[J].电子政务,2021(6):67-84.

猜你喜欢
陷阱
挖陷阱
注意题中的陷阱
暗处的陷阱(二)
陷阱
雄安,如何跳出被房地产绑架的陷阱
陷阱
陷阱
『陷阱』面前须提防
关于“中等收入陷阱”
陷阱2