数字化时代中文课外阅读文本库的构建

2023-06-27 03:24姜丽萍杨曦
中国大学教学 2023年3期
关键词:构建课外阅读

姜丽萍 杨曦

摘 要:课外阅读是学习者提升中文阅读能力的重要途径。当前,适合国际中文学习者阅读的文本素材匮乏,而基于数字化的文本阅读具有来源广泛、内容丰富、使用便利等優势。文章综合分析了将数字化文本用于课外阅读的优势与潜在问题,提出构建数字化课外阅读文本库的设想,重点讨论了数字化文本库的特征、功能与实现路径,以期为开展中文课外阅读、促进中文学习者阅读能力提升及阅读习惯的养成提供新的思路。

关键词:中文阅读;数字化文本库;构建;课外阅读

一、引 言

阅读能力是第二语言学习中的一项重要技能。学习者的阅读能力是在各种阅读训练中综合起来形成的[1]。但长期以来,对中文学习者阅读能力的训练主要在以教师为主导的课堂教学中进行,训练的“量”和“面”都远远不够,因而增加大量课外阅读就显得十分必要。

足够量的课外阅读离不开丰富多元的阅读文本作为支撑。为给尚不具备中文文本评估能力、也未很好养成中文阅读习惯的学习者提供合适的课外阅读文本,海内外研究者根据不同语言水平学习者的学习需求、心理特征、认知水平等,相继开发了一些中文分级读物,如《中文天天读》(朱勇等)、《实用汉语分级阅读丛书》(崔永华等)、《“汉语风”中文分级系列读物》(刘月华、储诚志)、《汉语分级阅读》(史迹)、《留学生汉语分级阅读指南》(姜丽萍)、《学汉语分级读物》(陈贤纯)等,这些读物在一定程度上解决了课外读物匮乏的问题。但由于纸质出版物开发周期长、更新速度相对较慢,很难满足海内外中文学习者日益多元的阅读需求[2]。另外,国内出版物在海外发行、销售渠道不畅,进一步阻碍了本就有限的纸质读物在海外的传播与使用。此外,由于缺乏统一的中文文本分级标准,不同读物之间衔接性较差[3-4],这些均给学习者长期阅读带来了一定的困难,因此,为中文课外阅读开发合适的阅读文本显得必要而紧迫。

随着新一代科学技术的发展与变革,人们的阅读方式与习惯正在悄然变化,以计算机、手机等智能设备为载体的数字化阅读逐渐常态化。青少年语言教学领域率先注意到了这一趋势,推出了多类基于母语或外语学习目标及文本分级标准的智能分级阅读软件。目前,针对成人学习者的分级阅读软件还较为少见。在国际中文教育领域,适用于成人学习者的课外阅读软件更为稀缺,数字化文本的诸多优势尚未得到充分挖掘,载体形式、综合开发等方面都相对滞后。有鉴于此,本文提出利用数字化文本优势构建中文课外阅读文本库的设想。

二、开展数字化课外阅读面临的主要问题与应对策略

网络上的数字化文本数量庞大、来源广泛、类型多样、内容多元,可以极大地扩展和延伸课外阅读的“量”与“面”。但同时,纷繁复杂的海量文本也带来了语言学习目标不明确、知识学习系统性被打破、阅读训练针对性难以保证等潜在问题。这些问题可以从以下三个方面加以解决:

第一,实现数字化文本与中文学习的对接,避免课外阅读与语言学习的目标衔接不上。中文课外阅读是课堂阅读教学的有益补充和延伸,其作用主要体现在激发阅读兴趣、提升阅读能力、扩充中文知识、培养中文阅读习惯[5]等方面。促进学习者中文阅读能力的提升是课外阅读文本库构建的最终目标,因而如何筛选适用于中文学习的阅读文本,使学习者切身感受到语言能力提升带来的愉悦,反向激发学习者的阅读动力,从而将课外阅读与语言学习的最终目标有机结合起来,是利用数字化文本开展课外阅读需要考虑的首要问题。

第二,重构碎片化文本中语言知识的系统性。数字化文本具有多信息源特点,浩如烟海的碎片化文本打破了传统学习的知识体系,尚未建构完整中文知识体系的学习者依靠自身知识储备难以发现文本知识之间的内在联系,容易陷入阅读浅表化的误区。单个数字化文本所蕴含的学习价值相对有限,利用不当甚至会影响课外阅读的效果。因此,探寻系统化组织课外阅读文本的有效方式,帮助学习者构建系统的中文知识体系、养成数字化课外阅读的习惯尤为重要。

第三,提升阅读的针对性,弥补教师角色的缺失。在数字化阅读中,学习者被赋予了阅读文本与阅读路径选择的自主性,在这种阅读方式中,传统的教师角色常常是缺失的,学习者被动承担起设定阅读目标、制订阅读规划、选择合适的阅读文本等任务。学习者还面临着加强自我驱动力、克服干扰因素、有针对性地训练阅读技能等挑战。如何发挥现代化技术的优势来弥补教师角色的缺失,帮助学习者建立适合个人特点与需求的阅读路径,培养其独立阅读的能力,是以数字化方式开展中文课外阅读需要重点考虑的内容。

三、数字化课外阅读文本库的特征

数字化课外阅读文本库拟通过以下三种特征的实现来衔接中文学习与课外阅读,重构语言知识的系统性,提升阅读的针对性。

1.文本语言难度适切化

文本语言难度的适切性是联结课外阅读与中文学习的关键,同时也是学习者选择合适阅读文本的重要标尺。文本语言难度的适切性离不开对中文文本难度指标的系统考察。近年来,以支持向量机(Support Vector Machine,SVM)为代表的基于多层面语言特征的机器学习算法在中文文本可读性分析方面取得了长足的发展,使大规模文本分级成为了可能[6]。教育部、国家语委2021年颁布的《国际中文教育中文水平等级标准》(以下简称《等级标准》)按照音节、汉字、词汇、语法“四维基准”,提出了面向不同水平等级中文学习者的语言量化指标[7],为阅读文本分级提供了重要参照。将支持向量机技术与《等级标准》结合起来,构建以《等级标准》中的语言量化指标为样本集的文本分级模型是本文本库的设计目标之一。利用该模型对文本库中的文本进行统一分级,能够有效衔接课外阅读与课内中文学习,实现数字化文本的精准化、标准化定级,并能为不同水平学习者提供适合自己的阅读文本。此外,基于语言难度的文本分级方式能将海量的数字化文本通过语言特征串联起来,促进数字化课外阅读中语言知识系统性的重构。

2.文本组织系统化

就文本阅读而言,知识的系统性是建立在对文本内容、功能等特征的挖掘上。话题是文本内容和语言环境氛围的中心,中文教学中的语言技能训练和语言知识掌握常常是围绕话题展开的。文本中话题的选择不但决定着常用词语的选用,还影响着语法结构、功能项目及文化内容的融入[8]。抓住文本话题才能抓住文本之间在内容上的内在关联。语体是语言运用的交际功能变体,体现着人们在长期的言语交际活动中形成的语言风格和特点,如,遣词造句特点、话语结构特点、修辞特点,甚至篇章结构特点等[9]。在文本分类中引入语体概念,旨在从功能层面挖掘文本特征及文本之间的内在联系。

话题与语体分别观照着文本的内容与功能,将二者结合起来,不仅可以建立文本内容之间的关联,还可以找到文本功能上的相关性,构建更为全面的文本系统。这是把单一的、碎片化的文本通过内容与功能特征聚类联结,串联成相互关联的立体化文本网络的有效方式。技术方面,词语类聚统计[10]、机器学习、知识图谱等可以为此提供有力支持。

3.文本呈现方式多模态化

数字化文本是一种动态的、立体的、开放的、外向的文本[11]。模态是人类感觉器官与外部环境互动的模式。将文本的文字内容与图像、音频、视频等模态结合起来呈现,可以为学习者带来多元感官刺激。比如,使用图片、视频、动画等视觉模态讲解、补充、说明难点内容,可以使相关知识可视化、形象化,提升文本内容的可读性;选择合适的模态介绍阅读文本中的语言知识、文化知识和跨文化知识,可以提升文本的可理解程度等。另外,不同学习者有着不同的感官倾向,恰当的模态转换有助于加强学习者对阅读内容的关注与记忆。结合学习者的个人感官倾向,有针对性地选用适合的模态向学习者呈现文本、讲解相关知识,可以更好地激发学习者的阅读兴趣,促进学习者对阅读内容的理解、内化与记忆,进而提升课外阅读的效果。

综上,文本库的三个特征主要对应于解决数字化课外阅读面临的三个基础性问题。文本语言难度的适切性及衔接度是联结课外阅读与中文学习的接口与纽带。以话题和语体为抓手来系统组织数字化文本,将文本库中的文本由简单的汇聚转变为系统化的类聚,是语言知识学习与语言技能训练系统性的基础与前提。另外,文本的难度、话题会对学习者阅读兴趣的建立与维持、阅读效果的提升产生影响[12-13];语体概念的引入有助于学习者感知不同类型文本的语言特点,这些都有助于为后续语言学习打下良好的基础。多模态呈现文本可以进一步提升文本的可读性,为维持学习者阅读兴趣、培养学习者阅读习惯提供有力保障,并能在一定程度上彌补课外阅读中教师角色的缺失。将这三项特征有机融入数字化课外阅读文本库中,不仅能为学习者根据个人阅读兴趣、语言水平和阅读需求选择文本提供便利,还可以为学习者系统阅读、长期阅读和深度阅读提供知识线索,促进学习者在阅读中不断完善中文语言知识体系。

四、中文课外阅读文本库的功能

阅读是个体与文本互动的过程。课外阅读是以学习者为主体的阅读,学习者的需求和兴趣是激发和维持其阅读动机的重要因素,他们的个人特点与课外阅读效果具有显著的相关性。数字化阅读面向的对象更为广泛,就群体而言,学习者之间的个体差异会在数字化环境中进一步凸显。因此,数字化课外阅读文本库的功能设计要建立在深入了解学习者个性化特征的基础上,为学习者提供符合他们个性需求的文本、路径、方法及目标引导,以更好地帮助学习者提升阅读能力、养成阅读习惯。中文课外阅读文本库主要具有智能诊断、路径规划、动态匹配、个性服务支持等四项功能。

1.智能诊断功能

对学习者特点的智能诊断是开展个性化阅读的前提。文本库的智能诊断功能既是为学习者匹配阅读文本、制订阅读规划、提供个性服务支持的主要依据,也是学习者根据个人能力选择阅读内容的主要参考。学习者特点主要包括其个性特点、知识经验、认知能力、学习需求、风格偏好以及具体学习情境等。智能诊断功能包括学习者自我评估、自适应测试、阅读监测三种方式。自我评估是学习者对个人阅读基础、阅读需求及阅读习惯等的评价,用于调查学习者的阅读背景。自适应测试是通过阅读测试的方式对学习者的阅读能力进行全面考察。自适应测试的关注点不仅在于学习者提交的答案本身,还蕴含着对学习者在阅读中的表现等的动态监控与分析,如阅读方式、阅读时长、阅读专注度等。这一动态监控与分析的过程即阅读监测。换言之,阅读监测是内隐于学习者阅读过程中并贯穿于阅读活动全程的一种诊断方式。文本库采用三种诊断方式,旨在对学习者阅读的前、中、后进行全方位智能测评,以综合了解学习者的语言能力和认知能力,挖掘学习者的阅读风格,从而实现对学习者的精准画像。

2.路径规划功能

学习者在课外阅读中具有一定的自主权,数字化的阅读方式进一步强化了学习者在文本与路径选择上的自主性。由于缺乏教师的系统指导,尚未养成良好阅读习惯的学习者在阅读中容易心浮气躁、缺乏规划[14]。自我管理能力欠缺的学习者在远程学习中很容易停滞不前[15]。在面对数字化文本中的多重链接时,即使是具备文本评估能力的高水平学习者也可能分散注意力、偏离学习目标。这时,阅读路径的规划与引导就尤为重要。文本库的路径规划旨在结合学习者个人特征,为其制订科学的阅读目标及系统性、有针对性的阅读计划,并在潜移默化中帮助学习者获得学习规划能力。文本库中阅读路径的规划主要通过三个步骤实现:(1)描述语言知识之间的结构关系。(2)基于大多数学习者阅读的需求与进程数据,提炼学习者语言知识发展进程,形成学习者基础阅读路径,作为学习者阅读目标与策略设定的依据。(3)根据学习者个人的智能诊断报告,为其制订包括阅读目标、阅读文本、阅读方式等在内的专属学习方案。

3.动态匹配功能

动态匹配功能主要依据学习者的语言基础、知识背景、发展潜能和阅读需求等,为他们匹配合适的阅读文本。该功能是保障个性化课外阅读实现的关键环节。由于学习者在阅读过程中的知识状态是不断变化的,为学习者匹配阅读文本时,不仅要关注学习者的既有能力,更要关注学习者的发展动态,主要包括:(1)关注学习者认知状态、知识水平的变化,及时调整阅读计划、相关阅读要求以及所推荐的阅读文本。(2)动态追踪与分析学习者的阅读表现,如内容、速度、专注度、行为、进度、时长、结果等,即时为他们提供阅读策略与学习方法等建议,实现策略与方法上的引导。(3)及时肯定学习者的积极表现、修正其消极阅读行为,使其在反馈与引导的循环中,逐渐克服对传统师生互动方式的依赖,适应人机互动,直至掌握自主阅读能力。

4.个性服务支持

智慧教育时代的语言教学正在由强调“统一的教”转变为“个性化的学”[16]。为使学习者的能力与个性在学习活动过程中得到充分、自由、和谐的发展,实现真正的个性化阅读,文本库为学习者设计了个性服务支持功能。该功能建立在尊重学习者个人需求与发展路径的基础上,主要包括四个子功能:

(1)个性化检索。个性化检索是学习者在规划路径之外自主挑选文本、进行独立阅读的文本检索通道。它以文本的话题、语体、难度、作者、来源等特征为类属,向学习者提供检索按钮。在每个检索通道中,文本的分类仍是有序的,学习者可以根据个人所需,选定其中一个或多个按钮通道进行目标文本挑选。

(2)阅读引导。阅读任务有助于调动学习者的阅读兴趣,使学习者明确阅读要求,并能引领其阅读进程[17]。阅读引导功能的主要机制是基于对学习者阅读难点的预判,为学生设定符合其“最近发展区”的阅读任务目标,而后再利用具有启发性的任务线索,将他们的注意力集中于阅读目标,刺激他们主动调动知识储备和阅读技巧,进而引导他们在“发现式”阅读过程中积极建构文本意义,并养成以既定目标为导向进行课外阅读的习惯。

(3)智能辅助。语言学习本身需要大量频繁的交互活动,同时在交互中也会产生新的知识,并训练语言技能[18]。智能辅助功能就是利用网络空间的交互性特点,通过语音识别、人机交互等方式,适时、适度地为学习者提供认知支架,以弥补数字化空间中教师角色的缺失,使学习者能够顺利地完成课外阅读任务,并帮助学习者在辅助指导的启发下找到适合自己的阅读方式。该功能是阅读方法与策略动态匹配的衍生功能,学习者可以根据个人需求和倾向选择是否需要阅读指导。

(4)云记录。云记录功能可以帮助学习者记录其阅读、检索过的文本,为回顾与查找提供便利。这些记录也是文本库分析学习者的阅读风格与偏好、向学习者提供更有针对性的推送与指导的重要数据来源。该功能可以进一步提升个性化阅读体验,并促进学习者养成回顾与思考的阅读习惯。

综上,文本库的智能诊断、路径规划、动态匹配、个性服务支持四项功能是文本库三种特征的具体体现。文本库各项特征与功能的设计都来源于对数字化课外阅读所面临的三个基础性问题的审视与思考,其目的在于实现高效率、个性化的中文课外阅读。文本库的特征、功能及其设计思路见图1。

五、中文课外阅读文本库的实现路径

本文构建的数字化课外阅读文本库是一个以优质的数字化文本为阅读对象,以立体化的文本系统为支撑,以学习者个人特征及需求为主导,兼具科学引导与动态监督功能的中文课外阅读系统。它的实现包括数据处理层、技术转换层、用户使用层三层架构:(1)底层为数据处理层,是将网页文本汇集处理后形成的数据中心,主要负责数据清洗、文本优化、特征标注以及文本任務化处理与多模态化呈现等。(2)中间是技术转换层,负责学习者数据与文本数据的对接与转换。其运行机制是依据学习者画像与文本特征为学习者适配阅读文本,再将适配的阅读文本整合为阅读路径,供学习者阅读使用。(3)顶层为用户使用层,作为学习者与阅读文本实现交互的界面,它包括智能评估、阅读使用和阅读记录三大子模块,分别对应于文本库智能诊断功能的可视化呈现、学习者阅读规划与个性化检索功能的具体实现以及学习者历史阅读数据的记录。

综上,基础数据层是文本的收集与处理中心,相当于整个文本库的智能仓库。技术转换层是整个文本库的中枢机构,是将文本数据和阅读功能进行对接,实现文本库动态匹配、智能引导等功能的关键层。用户使用层是呈现给学习者的功能模块,也是学习者与阅读文本实现交互的界面,展现了文本库的设计理念与功能特征。

六、结语

以云计算、大数据、人工智能等为代表的新技术与高等教育在数字化时代得到了前所未有的深度融合[19],数字化文本的出现为解决中文课外阅读的素材问题注入了新的思路。构建基于网络的课外阅读文本库,可以克服人工编制教材的思维局限性,进一步提升阅读内容的丰富性,帮助学习者在课外阅读中积累文化知识、扩展世界知识,还有助于学习者了解中国文化、融入中国社会生活。因此,本文提出了构建数字化中文阅读文本库的构想,并结合文本库构建面临的问题,探讨了文本库的特征、功能与实现路径。需要强调的是,本文提出的设计构想只是基于中文分级阅读现状进行的理论探索,数字化阅读文本库建设是一项复杂的工程,许多具体问题仍需在实践中进一步探讨与总结。

参考文献:

[1] 鲁健骥.认识·问题·对策——对外汉语阅读教学漫议[C].对外汉语读写课课堂教学研究.北京:北京语言大学出版社,2015(1).

[2]雷莉,张亚朋.汉语作为第二语言的分级读物出版现状及发展策略[J].编辑之友,2019(12).

[3]周小兵,钱彬.汉语作为二语的分级读物考察[J].语言文字与应用,2013(2).

[4]曹旸旸,张建.汉语分级读物的出版探究[J].出版广角,2021(3).

[5]姜丽萍.留学生汉语分级阅读指南[M].北京:北京语言大学出版社,2017.

[6]蔡建永.汉语二语文本可读性研究[D].北京语言大学,2020.

[7]中华人民共和国教育部,国家语言文字工作委员会. 国际中文教育中文水平等级标准:GF0025—0021[S]. 北京:北京语言大学出版社,2021.

[8]胡韧奋,朱琦,杨丽姣.对外汉语教学领域话题语料库的研究与构建[J].中文信息学报,2015(6).

[9]黎运汉,盛永生.汉语修辞学(修订版)[M].

广州:广东教育出版社,2010(8).

[10]刘华.词语计算与应用[M].广州:暨南大学出版社,2010(5).

[11]姜洪伟.数字阅读概念辨析及其类型特征[J].图书馆理论与实践,2013(9).

[12]刘颂浩.论阅读教材的趣味性[J].语言教学与研究,2000(3).

[13]柳茜.阅读教学成败的关键:选文趣味性——基于汉语学习者视角的反思[J].语言文字与应用,2018(11).

[14]王鸿滨.国际汉语分级阅读研究[M].北京:高等教育出版社,2020.

[15]岳俊芳,陈逸.基于大数据分析的远程学习者建模与个性化学习应用[J].中国远程教育,2017(7).

[16]姜丽萍,王立. 智慧教育视域下中文学习平台的构建:特征、功能与实现路径[J].国际中文教育研究,2021(4).

[17]李英杰.触及教学本质的阅读素养研究[J].语文建设,2020(23).

[18]贾巍巍. iSmart外语智能学习平台的开发与应用[J].中国大学教学,2019(3).

[19] 韩筠.在线课程平台推动在线教育十年发展的研究与展望[J].中国高等教育,2023(2).

[基金项目:北京高校高精尖学科建设项目(中国语言文学);北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)(22YCX088)]

[责任编辑:陈立民]

猜你喜欢
构建课外阅读
课外阅读——写作的源头活水
做好课外阅读指导之我见
从《蝉》到《昆虫记》,由自读延伸至课外阅读
点燃课外阅读的火焰
动车组检修基地与动车检修分析
环境生态类专业大学生创新创业能力培养体系的构建与实践
构建游戏课堂加强体育快乐教学的探究
共情教学模式在科学课堂的构建与实施研究
实践语文课外阅读的几点思考
让阅读像呼吸一样自然——课外阅读探究心得