基于ChatGPT的大学生数据素养教育研究

2023-03-02 09:23叶小娇
关键词:知识点素养教育

叶小娇

(皖南医学院图书馆,安徽 芜湖 241003)

0 引言

《国际图联趋势2021年报告最新动态》(《IFLA Trend Report 2021 Update》)指出,人们越来越有必要提升数据素养来顺应数字时代要求[1]。大数据时代,每个人都应该具备一定的数据素养,以便能更好地解读数据、利用数据并用数据去驱动决策。可见,数据素养将成为21世纪最重要的技能之一,美国、英国、加拿大等发达国家都非常重视本国公民的数据素养教育。2015年国务院印发了《促进大数据发展行动纲要》[2],提出要加强大数据专业人才培养。大学生是社会的中坚力量,提升大学生的数据素养对其适应未来社会和应对挑战都具有重要意义。

数据素养教育是推动大学生数据素养提升必不可少的途径。然而数据素养教育涵盖多个学科,国内缺乏针对性的教学体系,且教学资源和教师都缺乏,学生学习难度大。如何提高数据素养教育效率和质量,让更多的学生轻松掌握数据相关知识和技能,是一个值得研究的问题。ChatGPT的问世为大学生的数据素养教育提供了新的契机。ChatGPT是一种基于人工智能技术的聊天机器人,自2022年11月发布以来受到了各界的关注。《高等学校人工智能创新行动计划》[3]等文件的颁布也表明国家支持将人工智能创新应用到各个领域。本文将Chat-GPT引入到数据素养教育中,探讨基于ChatGPT的数据素养教育的优势和实践方案,力求提高数据素养教育效率,以满足学生在大数据时代的发展需求,为今后的数据素养教育提供一种新的思路和方法。

1 相关文献研究

1.1 数据素养教育研究现状

数据素养(data literacy)的定义学界目前尚无统一认识。Hegarty等[4]认为数据素养是一种能对数据进行有效使用、管理、创造、引用和分享的能力,是信息素养的子集;黄如花等[5]认为数据素养是信息素养的一种扩展,包括数据意识、数据能力和数据伦理;张静波[6]指出数据素养是科研人员在数据的采集、组织管理、处理分析、共享协作、利用等方面的能力,以及在各个过程中应遵守的规范道德。总的来说,数据素养就是要具有数据思维,掌握一定的数据技能,能够阅读数据、理解数据并利用数据,同时还要具备一定的数据管理以及数据伦理知识。

数据素养教育成为大数据时代的研究热点。国外数据素养教育开展得较早,美国早在2012年就率先从国家层面启动了数据素养教育相关措施,强调要重视国民的数据素养教育。Mandinach等[7]的研究形成了丰富的理论成果,包括数据素养教育培养模型、课程教学设计、教育评价工具的开发[8]等方面。在教学实践方面,高校也积累了丰富的经验,剑桥大学、罗格斯大学、哈佛大学、普渡大学、印度理工学院等图书馆针对不同的对象开展了教学活动,教学内容规范科学且教学方式多样[9],采用建立科学数据管理资源导航、数据素养通识教育、学科数据素养教育等教学模式[10]。国内数据素养教育起步晚,理论研究主要集中在对数据素养教育理论探讨、现状调查及策略研究等,如万文娟[11]从重视程度、教育形式、教育内容、教育对象、教育主体等方面对“双一流”高校图书馆数据素养教育的现状进行调查分析;张群等[12]提出了高校图书馆科学数据素养教育体系5W模型。在教学实践方面,北京大学、清华大学、上海交通大学等高校针对数据相关专业开展了嵌入式教学模式,但针对普通大学生的数据素养教育主要由图书馆开展,目前处在初期摸索阶段。绝大多数图书馆是以讲座、培训等教育形式为主[11],教学内容缺乏系统性,大多仅涉及数据素养的某一方面,仅武汉大学图书馆[13]、北京大学图书馆[14]、北京大学医学部[15]等少数几个学校开设数据素养教育通识课,为国内的数据素养教育提供了有益的实践参考。综上所述,数据素养教育在欧美国家已经非常普及,与实践活动联系紧密,并形成了横跨多个学科、教育主体多元化、面向不同层次受众群体的多样化的教学培养体系,国内则更多地停留在理论探讨阶段,缺乏顶层设计和总体框架,实践案例较少且教学方式单一,大多依托信息素养课程进行教学。

1.2 ChatGPT概述

ChatGPT是美国OpenAI公司开发的一种基于人工智能技术的聊天机器人,是GPT系列的3.5版本,ChatGPT的成功由算力+算法+数据的合成效应所致。GPT模型是基于Transformer神经网络架构的改进模型,这是一种用于处理大量文本数据的编码器和解码器块的集成系统,能够从海量的文本数据中提取有价值的信息,并通过训练来提高模型的准确性和可靠性。ChatGPT具有启发性内容生成能力、对话情境理解能力、序列任务执行能力和程序语言解析能力[16],特别是目前的最新版本GPT-4支持多模态预训练,实现了对视频、语音、图片等信息的整合,功能更加强大。

ChatGPT的飞速发展也引起了全球教育工作者的关注。王洪才等[17]认为ChatGPT将成为未来学校教育的重新定义者,它可能直接改变原有的学习方式,使得教育活动突破既定时空边界,带来教育形态的整体变革;焦建利[18]认为ChatGPT能助推学校教育数字化转型。ChatGPT强大的文本处理、即时交互、智能语义分析、智能问答等特点,不仅使个性化因材施教成了可能,而且还能减轻教师的常规教学工作负担,提升学习与教学效率。有些教师和学生开始借助ChatGPT开展一些工作。我国台湾多所大学拟制定善用ChatGPT指引办法,引导师生合理使用ChatGPT[19]。据调查,美国有89%的学生选择用ChatGPT写作业[20]。有些学者担心长期使用ChatGPT会使学生产生惰性思维,不利于其批判性思维的培养;同时,ChatGPT可能存在错误答案和偏见,学生缺乏判断力很容易被其误导;另外,Chat-GPT还涉及伦理道德、隐私等问题。因此一些教育机构明确禁止使用ChatGPT,如纽约市教育局阻止本部门设备和网络访问ChatGPT,香港大学发邮件禁止在课堂、作业和评估中使用ChatGPT。目前绝大多数高校对于ChatGPT还处于观望状态,不鼓励也不反对。

1.3 ChatGPT+数据素养教育的优势

目前的数据素养教育存在以下问题:(1)教育资源匮乏。数据素养教育跨多学科交叉知识,对教师队伍建设要求高,高校可开展该课程教学的师资团队少。另外,数据素养教育是一门新兴学科,目前没有相应的教材参考书[21],教学资源主要依靠教师通过网络资源自行收集整理,教学资源严重不足。(2)课程教学内容设计缺乏系统性、针对性和学科性。目前图书馆开展的数据素养教育内容系统性不强,存在重技能而轻意识等问题[22],传统的教学设计只能针对大多数人的学习需求,无法满足学生个性化的需求,学习效果不明显。(3)学生学习难度大,学习时间成本高。数据素养教育涉及统计学、生物信息学、信息科学、图书情报学等多学科知识,特别是对数据的清洗、分析及利用能力的学习,需要一定的编程基础,对于普通学生学习难度大。

将ChatGPT应用到数据素养教育中具有以下优势:(1)ChatGPT跨学科知识助力教学资源供给。大数据时代丰富的数据资源使ChatGPT成为精通所有学科的智者。教师在制定教学大纲、备课、上课及作业考核等各个教学环节中都可以向这个智能助教求助,ChatGPT能根据教师的需求生成学习和教学材料,一定程度上增加了教学资源供给,解决了师资队伍及教学资源不足的问题。(2)智能问答助力教学个性化学科化。学生根据课堂中教师提供的知识点提示词,再结合自身的专业知识,有针对性地去训练ChatGPT,使其提供符合自身需要的个性化答案。通过对相关内容的自主学习,使数据素养教学的针对性、学科性和个性化成为可能。同时它还实现了对学习问题和状况的精准分析,为学生提供个性化的指导。(3)即时问答助力学生学习效率。ChatGPT在学生学习过程中可充当24小时免费智能助教,任何问题都有问必答,反馈及时且答案准确度较好,好的体验利于激发其学习兴趣。Nvidia创始人黄仁勋曾认为在GPT的辅助之下,人人都可以成为程序员。ChatGPT擅长的文本处理、数据分析和编程能力能有效地提高学生数据技能方面的学习效率,解决大部分学生由于缺乏编程知识导致数据分析、数据可视化等知识点的学习困难问题。天津师范大学的王树义老师在利用ChatGPT进行数据分析、可视化和科学研究方面做了很多有益的尝试。

2 基于ChatGPT的大学生数据素养教育研究

ChatGPT的应用需要对整个教育制度、教育管理及教育理念的变革,更要教师转变教育观念,调动其在教育实践中的创造性。本文将从课程设计、教学应用场景及教育保障3方面论述ChatGPT如何融合到大学生数据素养教育中(图1)。

图1 基于ChatGPT的数据素养教育框架图

2.1 数据素养教育课程设计

大数据时代,数据素养教学的目标首先除了培养学生的数据知识、数据技能及数据伦理外,更应注重培养他们的数据意识和数据思维能力,引导学生在碰到问题时能从数据的角度看待分析,挖掘实质,形成良好的思辨能力。其次重点发展其跨学科多元思维和批判性思维,提出问题和解决问题的能力。最后还要培养学生的自主学习能力,持续学习新知识以应对科技的变化。

大学生数据素养教育的课程设计理念要体现层次化、渐进式、学科性和目标差异性的教学特征,采用分层化、模块化、案例化和项目化的教育思想,以基于科研生命周期的数据管理为顺序进行设置。本科生的课程以基础性和导向性为主,立足于建立数据意识。研究生的课程更侧重专业性,注重学科领域数据知识和相关技能的学习。

基于ChatGPT的数据素养教育内容分为2大部分,一部分是ChatGPT的基本知识,包括ChatGPT的基本原理、使用技巧(提示词)及注意事项等。目的是提高学生对ChatGPT及人工智能的认识,了解其利弊,教育和引导学生合理合法使用,遵守学术诚信,注意数字安全,防止个人或他人隐私的泄露。这部分内容的教学贯彻到整个课程教学中。另一部分是数据素养教育内容,包括数据意识、数据知识、数据技能和数据伦理4大部分(图2)。数据意识是指对于数据的敏锐感知和理解、在日常生活和工作中运用数据进行决策和解决问题的能力。数据知识是指在数据的整个生命周期中,对数据进行有效管理和维护的技能和方法,如数据的管理计划、创建、保存的方式等。数据技能主要是在数据的获取、清洗、分析、可视化、利用与共享方面的技能以及在数据分析中一些常用工具的使用介绍。该模块知识点的介绍应充分利用ChatGPT的编程优势,在教学中需要更加强调计算思维与算法思维的培养,减少对程序语言中语法细节的记忆性学习。数据伦理就是要让学生了解数据采集、使用、分享中所涉及的道德和伦理问题,熟悉政策法规和引用规则,尊重他人的数据成果。在对各个知识点讲解过程中,教师应教授如何向ChatGPT提问该知识点的内容,为学生提供可参考的提示词,并引导学生根据自身专业的不同扩充提示词,方便学生课后复习或个性化扩展学习需求。

图2 数据素养教育内容

教育方式采用“线上+线下”混合式教育,融合多种教育形式,如课堂教学、微课、慕课(massive open online course,MOOC)、比赛及活动等。本科生的教学以通识课的形式更为合适,以课堂教学为主,注重实验教学。研究生的课程可根据实际需要进行模块化选择学习,以讲座、短期培训或线上自主学习方式为主。

考核形式上教师需要改变传统的考试模式,尽量避开以记忆为主的事实问题,而应关注学生如何使用数据、寻找数据解决问题等能力。考核形式可采用试卷考评、案例分析、数据报告、项目报告、数据竞赛、发表论文等形式。教师根据教学对象及课程知识点的特点,自由组合多种考核形式。教师可以利用提示语借助ChatGPT来协助设计随堂练习、测验题、数据研究课题等,作业设计尽量做到情境化。教师也可通过举办小型的数据素养竞赛或鼓励学生参与各种数据素养竞赛如“全国高校数据驱动创新研究大赛”“慧源共享”数据大赛等形式来实现对学生能力的综合测评。

在实际教学中,教师要根据教育对象设置不同的教育模式,确定其教育目标、教学内容、教育方式及教学评价等。

2.2 ChatGPT助力教学应用场景

ChatGPT的实时交互、智能问答等功能在教育领域中具有很多潜在的优势和应用前景。教师将其嵌入到整个课程教学过程中,助力教学实践。以下介绍在课前、课中和课后3个阶段如何利用Chat-GPT进行教学辅助和个性化指导。

1)课前——教师备课好帮手。教师可以通过与ChatGPT对话来整理相关知识点,为教学思路提供一些灵感和参考。在备课过程中碰到不熟悉的知识点,可直接向ChatGPT提问获取相关的解释和例子。教师通过在ChatGPT中不断地尝试提示词训练,寻找该知识点的最优提示词,为课堂中的教学演示及学生课后复习实践自学做准备。当教师需要制作课件时,ChatGPT可以通过快速生成教学素材,如图片和文本等,来提高教师的效率。教师还可利用ChatGPT生成数据可视化知识点的练习题或数据案例来考核学生。

2)课中——师生教学实践工具人。教师通过ChatGPT调用图片、视频、文字等信息模拟实际应用场景和问题,使课堂变得更加有趣生动。对于一些编程抽象的知识点,教师利用事先确定好的提示词,在课堂中进行实践演示,加深学生对知识的理解。教师还可借助ChatGPT搜索不同学科专业数据案例进行数据分析可视化操作实现数据素养教学学科化个性化。教师在课堂中要时刻引导学生合理辩证地利用ChatGPT,规避其在技术、安全、知识产权、信息真伪等方面的不足。每堂课结束后,教师必须提供本节课相关知识点的ChatGPT提示词和课堂小练习,方便学生课后去实践复习巩固知识。例如,面对不同数据展示需求如何选择合适的图表类型,结合自己的专业特点找一篇公开数据集的论文,复现论文中的图表。

3)课后——学生实时智能助教。学生温习老师上课的知识点并把老师上课的例子重新实践运行一遍,碰到问题可随时向ChatGPT提问。学生可根据老师提供的提示词进行实践练习,体验不同图表类型所表达数据展示效果。如箱线图常用于展示数据的大致分布特征,练习题“比较数据集birthwt里不同人种新生儿体质量的情况”,散点图矩阵可以用来展示多个变量两两之间的关系,练习题“绘制数据集iris鸢尾花里各项测量指标之间的散点图矩阵”。学生可以自行编写Python程序代码,出现运行错误的时候,直接复制代码向ChatGPT提问,它会找出错误,并返回修改过的程序,对一些关键点它还会提供代码解释说明。ChatGPT还可以根据学生的学习情况和反馈,向学生推荐一些相关论文里面图表的制作,以帮助学生进一步巩固和拓展所学知识。

虽然ChatGPT有很多优势,但其智能水平取决于训练的数据集和算法,质量不高的数据集可能会使其答案存在一些错误或偏见,学生只有掌握一定的数据素养知识后,才能对ChatGPT提供的答案进行批判性认识。因此在教学中教师要注重基础知识的传授、注重整个知识体系的讲解,培养数据思维,让学生掌握判别答案对错所需的知识储备。

2.3 数据素养教育支撑保障

要保证基于ChatGPT的数据素养教育顺利开展,必须构建一定的保障体系,包括ChatGPT相关政策的制定、教师团队建设、教育平台构建等内容,以提高数据素养教育的可操作性与可实施性。

1)ChatGPT相关政策的制定。尽管AI技术能够给教育带来很多好处,但需要意识到其中的风险和挑战,并采取相应的措施来保护学生和教师的权益。需要加强对教育人工智能的监管和研究,并制定具体可执行的规范和建议;关注AI相关技术伦理、隐私保护以及数字鸿沟问题;引进人工智能检测工具,帮助学校和教师防止学生滥用;加强师资培训,让教师掌握如何正确使用AI工具以及利用它们来协助教学。只有这样,才能最大限度地发挥AI技术的优势。

2)教师团队组建。黄如花等[5]认为数据素养教育除了图书情报学外,还涉及统计学、生物信息学、信息科学、商学、教育学等。数据素养教育内容比较宽泛,教师团队成员不仅需要具备扎实的数据管理知识与统计分析能力,还要掌握数据服务的相关知识与技能。高校的数据素养教育建议采取多方协同发展的管理机制,图书馆员、计算机教师、统计学教师、实验员、科研管理人员等开展合作,共同探讨数据素养的教学内容,根据各自的特长,共同分担课程任务。另外还可以建立一些专题数据素养教育团队形式增加其学科性,作为数据素养教学团队的补充。例如,美国弗吉尼亚大学建立了针对工程学、人文科学、生命科学、物理学和社会科学数据管理教育团队。

3)教育实践平台的建设。高校可通过建立数据共享空间,吸引大学生加入。例如北京大学图书馆建立了北京大学开放研究数据平台,为研究人员提供数据存储、管理与共享系统,复旦大学设立大数据与知识工程实验室等。一方面建立大数据应用平台或大数据收集和分析实验室等能为学生创造尽可能多的实践机会,加强知识学习转化,提高学生的数据操作技能;另一方面搭建交流与互动平台能掌握用户的数据服务需求,调整数据素养教育内容使其更符合学生的学习需求,利于提高大学生数据素养教学质量。

3 结束语

数据已深度融合到日常的生活、工作和学习中,数据素养正成为人们适应大数据智能时代的重要能力。高校通过数据素养教学的目的在于培养学生的数据思维能力,提升其用数据认识世界、改造世界及解决问题的能力。ChatGPT在编程、阅读和写作方面的效率,以及其通过智能交互、分析和解释层给用户带来的优越体验,对数据素养教育资源的普及、教学效率的提高、学生全面发展和个性化成长的促进等方面有很大的帮助。

猜你喜欢
知识点素养教育
国外教育奇趣
题解教育『三问』
一张图知识点
一张图知识点
第四页 知识点 歼轰-7A
必修上素养测评 第四测
必修上素养测评 第三测
必修上素养测评 第八测
必修上素养测评 第七测
教育有道——关于闽派教育的一点思考