基于统计软件的统计学教学研究与实践

2018-09-03 07:09周晓东王云娟
大学教育 2018年7期
关键词:R语言

周晓东 王云娟

[摘 要]大数据背景下,统计软件越发重要。统计软件对统计学教学有着重要的支撑作用。统计软件的适度应用有利于增强学生对统计概念、理论和方法的理解和掌握,培养学生的编程思维,提升学生解决实际问题的能力,掌握学科交叉知识。

[关键词]统计软件;统计教学;R语言

[中图分类号] G642.0 [文献标识码] A [文章编号] 2095-3437(2018)07-0045-04

统计学作于一种处理不确定性现象的重要定量分析工具,被广泛应用于社会、经济、工程等各个领域。会处理数据,利用数据和统计方法进行统计推断已经成为现代大学生的一种重要素养。鉴于此,统计学已成为众多专业的必修课程。然而已有的教学经历和文献研究发现由于学生专业背景、学习能力等不同,多数学生的统计学习都存在一定程度的困难。同时由于新的数据形式不断出现[1]、新的数据分析技术以及互联网技术的发展,在促进统计学学科发展的同时,也对统计学教学提出了挑战,使得统计教学的内容、教学方法以及统计学习方法都产生了较大的变化[2]。文献[2]~[7]分别对当今统计教学中所面临的问题、技术创新、教学改革等进行了总结和有益的探讨。尽管如此,由于我国统计学学科建立比较晚,长期以来统计教育工作者存在对统计软件在统计教学应用中的重视程度不够,或者虽有应用,但程度不深或方法不对,或心有余而力不足[8]。本文我们对统计软件对统计教学支撑做了初步的探讨,同时给出一些应用实例和应用建议。

一、统计软件的选择

目前市场上有多种软件能用于统计分析,如SPSS、Stata、SAS、Statistica、S-plus、Minitab、R语言。除此外Excel也常被用于统计学教学。 不同的软件都有着自身的优势和劣势。很多文献都对此作了有关的探讨。统计软件的选择往往需要根据具体的教学环境来定,如软件的使用费用、软件获取的便利度、学生的专业背景和学习能力、教学目的等。商业统计软件如SAS、SPSS、S-plus等虽然普及度高,为大的企事业单位、科研机构、商业领域人员所熟知,但使用成本高昂,非普通学生所能承受。因此从学生角度来考虑,希望软件的选择 (1)有利于学生在课后也能应用,而不只是在学校实验室,(2)与企业应用相匹配,学生掌握后,方便就业,(3)确保学生学习软件的时间不长,(4)易于获得丰富的帮助文档,(5)统计分析方法全面,(6)适用于各种操作系统。在前面我们罗列的统计软件中,唯一满足这些要求的就是R软件。

R软件由新西兰奥克兰大学Ross Ihaka和Robert Gentleman创建,目前由R语言开发核心团队开发。R统计软件由于其开源、免 费、高效的特点广为数据分析者所推崇。R软件的优点:(1)相对于商业软件如SPSS、SAS等,R是免费的;(2)适用于多种系统,如Windows、MacOS、GNU/Linux 及Unix;(3)有着丰富的帮助文档;(4)广泛应用于多个领域,如基础统计学、社会学、经济管理、金融、空间统计、生物制药;有不同领域的使用者同时也是开发者提供基于领域的数据和方法;(5)R是一种编程语言,允许使用者根据自身需求,按照统计方法编写分析程序;(6)R使用者针对不同需求开发了不同的包,到2018年1月15日CRAN上收录了12097个各种不同的统计分析包。选择利用R软件作为统计教学辅助统计软件可以满足前述的学生对统计软件多种需求。 利用R软件强大的数据可视化能力,丰富的统计软件包以及强大的统计编程能力辅助非统计学专业统计学教学可以使得统计学教学易于从传统的强调统计的数学因素(计算、公式、推导)转向注重培养学生的统计素养、统计推理以及对统计结果的解释、评价等。 利用R软件辅助统计专业课教学,有利于做好不同专业课程之间的切割,如《统计软件SAS》,增强教学的吸引力。同时拓展学生的知识面,达到一专多能。

尽管上述优点,但R是一门编程语言,对于部分学生来说,学习有困难,尤其是对非统计专业的学生。为解决上述问题,R包开发者开发了一些友好的交互界面,如R Commander,RStudio等。R Commander(Rcmdr包)是基于R的图形化交互式界面。优点是无需用户记住各个命令的名字和函数的參数等。只需要通过对话框,采用鼠标点击按钮进行操作,这对于R初级使用者特别有吸引力,也有利于教师使用R进行教学。RStudio是一种R语言的集成开发环境(IDE),其亮点是出色的界面设计及编程辅助工具。它可以在多种平台上运行,包括windows,Mac,以及网页版。与R软件一样,其也是免费和开源的。

二、利用统计软件辅助统计教学

鉴于R统计软件的优点,本节我们介绍统计软件辅助统计教学的具体实践。利用统计软件(如R)辅助统计教学可以做到以下几点:

(一)减轻计算负担

统计学基础课程中往往涉及到基础统计量的计算,如样本数据的方差、估计区间、检验统计量、回归系数等,还有包括分位数的查找。教学过程中需要花一定时间解释这些量的计算。统计软件应用可以帮助老师和学生从这些计算的烦恼中解脱出来,比如统计分布的分位数、累积概率的计算等R中有系列函数可以轻松完成这些工作,从而让学生专注统计思想和方法的理解和应用。

(二)提供丰富的数据探索分析工具

统计软件的应用,尤其是R统计软件中的各种统计分析包,丰富了学生利用统计软件对数据进行探索性分析的工具,提升学生直观认识数据的能力。例1给出了美国黄石公园老实泉数据探索分析结果。通过滑动图中的滑动按钮,可以清楚看到不同分组数对直方图的影响,另外通过点击图中下拉按钮,可以选择不同的拟合分布,选择与直方图最吻合的理论分布。

例1:直方图及分布拟合

library(mosaic) if(require(manipulate)){ manipulate(histogram( ~waiting,data=faithful,n=n,fit=distribution,dlwd=4),n = slider(5,40),distribution= picker(‘normal,‘gamma,‘exponential,‘lognormal,label=“distribution”))}

通过鼓励学生对数据进行探索可以促使学生对数据做深层次的思考,了解数据背后的故事,为统计概念引出和进一步统计分析奠定基础。

(三)抽象概念直观化

由于統计软件在计算和数据可视化上功能强大,基本即时可以得到想要的分析结果。因此应用统计软件辅助统计教学,我们很容易通过更改各种统计方法条件,考察条件对统计结果的影响,使得理论与直观更好地结合起来。比如在回归分析中讲解异常点对回归分析结果影响时,我们可以通过针对有异常点的数据和不含异常点数据的统计分析结果和回归分析结果的图示,让学生充分理解考虑异常点的重要性。作为统计教学和研究的一个重要手段——统计模拟常被用来解释统计分析中一些比较抽象的概念,如抽样分布和置信区间。与理论结果形成互补,更好地让学生领悟这些概念和方法的本质。例2我们利用R软件包TeachingDemos里的函数clt.examp解释总体分布、样本容量对样本均值分布的影响,从而导出抽样分布中重要的定理——中心极限定理。例3我们利用统计软件R包animation 中的conf.int函数,或者包TeachingDemos包中的函数ci.examp演示置信区间的构造,说明置信水平与真实覆盖率的关系。

例2:中心极限定理

library(TeachingDemos)

clt.examp(n=1)#图2

clt.examp(n=5)#图3

clt.examp(n=30)#图4

例3:置信区间

library(animation)#文献[9]

conf.int( )

# 或者

library(TeachingDemos)

ci.examp(method=“t”)#图5

(四)培养学生的编程思维

编程思维是计算机科学解决问题的一种强有力的思维方式。统计学方法是以解决问题为导向。虽然在统计软件中有很多的现成的程序,帮助学生解决问题,但实际上最好的教学方式是让学生在理解好统计概念之后,自己编写程序解决问题。学生通过自己编写程序来深化和检查自己对概念的理解。例如,编写计算最小二乘拟 合、残差和判定系数的函数,编写和测试这些代码需要他们正确理解相关概念,消除各 种可能的误解。R软件作为一种编程语言,可以胜任学生在学好统计学的同时,培养学生的编程能力。

(五)对案例教学、项目教学法等形成有效的支撑

案例教学、项目教学法的优点[10],包含:(1)让学生认识到统计方法在解决现实问题中的适用性和重要性;(2)让学生对来源于实际问题的案例统计分析会产生更为浓厚的兴趣;(3)学生对案例中感兴趣的问题参与度更强。统计软件的应用可利于达到案例教学法、项目教学法想要达到的效果。

三、应用统计软件辅助统计教学需要注意的几个问题

(一)处理好统计软件与统计学教学的关系

统计软件在统计专业课程教学中只是起到辅助的作用,而不是替代统计思想和方法的教学,因此课程教学中一定要明确统计课程的教学目标。让统计软件的使用服务于统计课程教学的目标,切不可喧宾夺主。需要设计好统计软件在统计课程的教学环境,以及统计软件的使用程度。教学过程中不当地使用统计软件或对统计软件的过度讲解不但不能提升教学效果,反而会产生负作用,增加学生对统计学习的焦虑,产生厌学情绪。 在应用统计软件进行统计学公共课教学时,应该充分考虑不同专业背景学生对统计软件的接受度。对偏文的专业,重在演示,让学生理解统计思想,掌握统计方法;对偏理工的专业,在注重统计思想的同时,让学生建立编程思维和编程实践。

不同课程的教学目标不同,因此在应用统计软件进行教学的过程中,软件的使用程度应该有所差异。在统计基础课程中 如统计学导论等注重统计思想的介绍。统计软件使用的目的是为了更好地帮助学生理解和接受统计的思想。而在一些高级课程中,统计软件的应用重点在于让学生掌握统计方法,应用统计方法解决实际数据分析。

(二)避免对统计软件的不当应用

使用统计软件辅助统计教学的一个优点是可以很容易完成许多复杂的统计分析,但也容易造成学生对统计软件的过度依赖,同时减少了学生对相应统计方法的理解,从而导致对统计方法的不当使用。因此统计学教学中需要处理好统计软件在统计教学中的使用深度和方式。重视学生对统计软件分析结果的判断和解释,让学生在对数据的探索和对统计分析结果的解释中真正透彻地掌握所学统计方法。

(三)注重统计教学内容、教育方法和统计教学软件等教学辅助技术的有效融合

统计教学效果的提升是多种教学方法和教学技术共同作用后的结果。将统计软件合理地与项目教学法、案例教学法、问题式教学方法、合作学习方法综合使用,可以增强教学效果。反过来,这些教学方法和学习方法也能促使学生对统计软件掌握的熟练程度,最终加深对统计方法的理解和应用。

四、结语

统计学由于其学科特点及其独特的思维使得学生在统计学习过程中存在各种困难,如何将统计的思想和方法传输给我们的学生需要统计教育工作者不断地探索,任重而道远。国内统计学教学虽取得了不俗的成绩,但仍存在较大的提升空间,需要统计工作者不断努力,需要做到统计科学研究和统计教育研究并举。在做好基础统计教育的同时不断探索新的有效的教育方法。

文献[11]在对已有统计教学研究的文献进行回顾的基础上提出了统计学习的8条原则:(1)统计知识学习是一个知识建构的过程;(2)有效的学习需要学生活动的积极融入;(3)有效的学习需要不断地实践;(4)不能低估学生对概率和统计中基本概念理解上的困难程度;(5)不要高估学生对基本概念的掌握程度;(6)只有让学生充分认识其在推断过程中理解上的错误学习才能真正得到提高;(7)应该充分利用各种工具帮助学生可视化数据以及探索性分析数据;(8)学生在学习过程中如果能得到持续有效的反馈,学习效果将大幅提升。这8条原则对我们进行统计教育教学研究和设计有着比较好的指导意义。兼顾统计软件的特点和这些统计学习的原则,有助于我们更好地搞好统计教育教学工作。

[ 参 考 文 献 ]

[1] 徐国祥,李波. 大数据、云计算背景下的统計改革与创新[J]. 中国统计,2016(6):4-7.

[2] Chance,Beth,Ben-Zvi,Dani,Garfield,Joan,Medina,Elsa. The Role of Technology in Improving Student Learning of Statistics[M]. Technology Innovations in Statistics Education. 2007.

[3] Tishkovskaya, Svetlana| Lancaster,Gillian A. Statistical Education in the 21st Century:A Review of Challenges,Teaching Innovations and Strategies for Reform.[J]. Journal of Statistics Education,2012,20(1):114-115.

[4] Larwin K,Larwin D. A Meta-Analysis Examining the Impact of Computer-Assisted Instruction on Postsecondary Statistics Education[J]. Journal of Research on Technology in Education,2011,43(3):253-278.

[5] 崔玉杰,刘喜波. R和Python软件在《概率论与数理统计》教学中应用初探[J]. 教育教学论坛,2017(12):192-193.

[6] 程胜. R统计软件及其在《时间序列分析》实践教学中的应用[J]. 教育教学论坛,2014(41):173-175.

[7] DellOmodarme M,Valle G. Teaching statistics with Excel and R[J]. Physics,2006.

[8] 刘超,吴喜之. 统计教学面对的挑战[J]. 统计研究,2012(2):105-108.

[9] Xie Y,Grün B,Pebesma E,et al. animation:An R Package for Creating Animations and Demonstrating Statistical Methods[J]. Journal of Statistical Software,2013,53(1):1-27.

[10] Lane D M,Scott D W. Simulations,case studies,and an online text:a web-based resource for teaching statistics[J]. Metrika,2000,51(1):67-90.

[11] Garfield J,Ben-Zvi D. How Students Learn Statistics Revisited:A Current Review of Research on Teaching and Learning Statistics[J]. International Statistical Review,2007,75(3):372–396.

[责任编辑:林志恒]

猜你喜欢
R语言
基于Holt—Winters时间序列的图书选题预测模型
基于R语言的轿车销量分析基于R语言的轿车销量分析
基于R语言时间序列的轿车销量分析及预测
R语言在统计分析中的使用技巧
基于R语言的学生成绩分析
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
基于R语言的湖南产业结构对其经济增长贡献分析
注重统计思维培养与应用为主导的生物统计学课程建设
人民币汇率的均值回复检验及Hurst指数计算