第二语言词汇量测量工具研究综述

2017-04-11 03:22张江丽
海外华文教育 2017年2期
关键词:第二语言词汇量工具

张江丽

(北京华文学院,中国北京102206)

第二语言词汇量测量工具研究综述

张江丽

(北京华文学院,中国北京102206)

词汇量是反映第二语言学习者语言水平的重要指标。本文对英语第二语言和汉语第二语言教学界有关词汇量测量的工具进行了综述,分析了词汇测量结果产生差异的原因,以期为编制高水平的词汇测量工具提供参考。

词汇量;测量工具;第二语言学习

词汇量是反映学习者词汇习得水平的重要指标,一直以来受到语言教学研究者和语言学习者的关注。语言教学研究者想了解第二语言学习者到底掌握了多少词汇量,第二语言学习者想知道自己掌握的词汇量到底达到了什么水平。在制定第二语言教学大纲时,词汇量是需要考虑的重要指标。要想制定适合并能反映学习者水平的词汇量标准,首先就要了解不同水平的第二语言学习者词汇量的现状,这就离不开对他们的词汇量进行测量。

在第二语言习得研究中,有关词汇量的测量直到20世纪80年代才开始受到重视。第二语言学习者词汇量的测量始于英语第二语言教学领域的研究。20世纪80年代,英语第二语言教学界的一些学者先后编制了测量学习者英语词汇量的工具。直到21世纪,随着汉语第二语言教学的发展,一些学者才开始编制汉语词汇量测量的工具。

一、英语第二语言教学界较有影响的词汇量测量工具

1.Nation(1983)编制的“VLT”

新西兰学者Nation在1983年设计了Vocabulary Levels Test(词汇等级测试卷,简称VLT),该问卷设计之初,主要是为了帮助教师调查学习者的接受性词汇量。Read(1988)对该测量工具的效度进行了验证。该测试包括五个水平的词汇量的试卷:即2000、3000、5000、10000词汇。

在第二语言词汇测量工具缺乏的时代,这一问卷在当时影响很大,一经问世就被广泛采用。1990年,Nation出版了第二语言词汇研究的专著Teaching and Learning Vocabulary,书中介绍了VLT的具体设计,这也进一步推动了VLT的传播。1993年,Nation又制定了不同版本的VLT,后来形成了4个版本,即Version A,Version B,Version C,Version D。

2.桂诗春编制的词汇调查量表

1983年秋至1984年春,中国英语专业教材编审组先后在我国十余所外语院系对英语专业二、四年级学生进行了一次英语水平测试。

英语词汇量调查是这次测试的一个重要组成部分。这一测试以10000个英语常用词为调查范围,使用分层随机抽样的办法从中抽出200个样本,配以汉语的正确答案和干扰项目,组成一份试题,然后根据成绩推断出学生的英语词汇量。这一词汇量表开创了中国英语第二语言教学界词汇测量的先河,后来被很多学者采纳和使用,学者们在不同类型的学生群体中进行过多次试验,取得了较可信的结果。

3.Nation(1990)编制的“10000水平词汇量测试”

该测试是一个控制性产出词汇量的测试(controlled productive vocabulary test),旨在衡量被试对词汇的掌握程度。这是一个具有一定的信度和效度、在国外被研究者普遍采用的测量工具(Laufer,1998;Laufer&Nation,1995;Meara&Fitzpatrick,2000)。

在词汇范围的选取上,与VLT一样,这一新的测试也旨在测量学习者在高频、中频、低频和学术类词汇方面的词汇知识。测试采用完形填空的方式,为了避免其他可能的答案,题目中给出了目的词的前一个或几个字母,通过句子填空来估算学生产出性词汇量。

该测试共有18个不完整的句子,要求被试根据语境和所提示的开头几个字母填入合适的单词,词性和词形必须正确。填对一个单词得一分。这种测试方式对被试提出了更高的要求,不仅要求被试正确拼写单词,而且还得掌握词汇知识。

例如:“The crowd soon disp_____ when the policemoved.”正确单词应该是disperse。Disperse的其他形式均被视为错误。

4.Read(1993)编制的词汇深度知识测量工具

Read于1993年推出了自己制定的词汇深度知识测量工具。这一测试采用词汇联想测试(Word Associate Test)的方式,旨在测试学习者词汇习得的深度。

1998年,Read对原试卷进行了修订。该试卷所测试的词语均为高频词,一共包含40个目标词。每个目标词均有8个选项,每4个一组放在左右两个方框中,要求学生选择4个在语义上与测试词有联系或能与测试词构成搭配关系的词。

该测试主要从词语搭配的角度来测试学习者的词汇使用能力,分别测试目标词的聚合关系,即近义词及词的多义项以及词的组合关系,共4个正确选项。

如sound:__________________________________________________________________ logical、healthy、bold、solid snow、temperature、sleep、dance

在左边方框中,与目标词“sound”意思接近的有3个:logical、healthy和solid。在右边方框里与“sound”可以搭配的词有1个,为“sleep”。正确答案数量不确定,左边方框中与目标词意思接近的词可以是1个、2个、3个、4个。右边方框中可以与目标词搭配的词数量同样也不固定。这样可以减少受试的盲目猜测。每选对一个得1分,选错为0分,总分为160分。

5.Schmitt等人(2001)编制的“VLT”

Schmitt,Schmittand Clapham(2001)在Nation(1983,1990)词汇量测试问卷的基础上设计了一套新的试题。该测试包括五个水平的词汇量的试卷:即2000、3000、5000、10000以及学术词汇。所测试的词汇量越多,所测试的词的频率越低。其中2000词汇和3000词汇代表英语中的高频词,5000词汇处于高频词和低频词之间,10000词汇代表低频词。其中的学术词汇来自Coxhead(2000)学术词表,该词表覆盖了28门学科中出现频率最高、使用度最广的词语,一共包含570个词语。

在平衡了词汇的难易程度及词汇教学的需要后,Schmitt等人将学术词汇部分置于3000词和5000词之间。

Schmitt等人编制的试卷每个部分包含10道题。题型采用词义匹配的方式,每道有六个目标词,三项英语释义,要求被测者从六个目标词中选出符合英语释义的三个词,被试答对一个得1分,答错为0分,总分为156分。英语的释义均采用1000到2000词汇水平的高频词,避免受试因看不懂英语释义而影响测试的有效性。该测试的一大优点是能给出各个词频层次上的词族量,能对词汇量的发展提供更精细的指标。

2000、3000、5000、10000以及学术词汇这五个水平各有十道题,现各选一道题展示如下:

The 2000 word level

(1)copy _____end or highest point

(2)event _____thismoves a car

(3)motor ______thing made to be like

(4)pity

(5)profile

(6)tip

The 3000 word level

(1)bull ______formal and seriousmanner

(2)champion ______winner of a sporting event

(3)dignity _____building where valuable objects are shown

(4)hell

(5)museum

(6)solution

Academ ic Vocabulary

(1)area written agreement

(2)contract ______way of doing something

(3)definition ______reason for believing something is or is not true

(4)evidence

(5)method

(6)role

The 5000 word level

(1)analysis _____eagerness

(2)curb ______loan to buy a house

(3)gravel ______small stonesmixed with sand

(4)mortgage

(5)scar

(6)zeal

The 10000 word level

(1)alabaster _____small barrel

(2)tentacle _____softwhite stone

(3)dogma_____tool for shaping wood

(4)key

(5)rasp

(6)chandelier

6.Nation和Beglar(2007)编制的“VST”

虽然VLT在英语词汇量测试中被广泛运用,但是Nation并不满足于此。在他看来,VLT只能模糊说明受试的词汇量水平。后来他在VLT的基础上进行了修订,在2007年,Nation和Beglar两人于2007年合作编制了Vocabulary Size Test(词汇量测试卷,简称VST)。随后Beglar(2010)证实了VST的效度。Beglar认为VST为教师和研究人员测量二语学习者的书面接受性词汇量提供了一种新的工具,该工具提供的测量是可靠的、准确的、全面的,是能够精确判断学习者词汇量的水平测试。

VST包含最常用的14000个英语词族。其中每1000个词为一个等级,每一个等级有10个测试项。VST总计有140个测试项。每个测试项的每一个被测词放在一个简短的语境中。测试采用多项选择的方式。

测试范例如下:

Miniature:It is aminiature.

a.a very small thing of its kind

b.an instrument to look at small objects

c.a very small living creature

d.a small line to join letters in handwriting

二、汉语第二语言教学界的词汇量测量工具

在汉语第二语言教学中,有关词汇量的调查并不多。值得关注的有以下几个:

钱旭菁(2002)以《汉语水平词汇和汉字等级大纲》中的甲、乙两级词(3051个)为测量常用词的词汇范围。选取了其中的名词、动词和形容词。并给名词、动词、形容词分别编号,然后采取等距抽样的方法,隔七选一个,最终选取了300个词作为测量试卷中的目标词。问卷采用释义法和翻译法的形式分别进行调查。

张和生(2006)设计了“留学生汉语词汇量测量表”。采用随机抽样的方法从《汉语水平词汇与汉字等级大纲》中随机抽取,但这种抽取又非完全随机,而是考虑词语的等级(词频)、音节、词类、词义选择样本,并适当考虑词语样本书写笔画的多寡等因素。在不得不考虑控制测量时间长度的限制下,每一级词汇的选择比例均控制在1.5%,共选取132个词语作为测量样本。该统计仅限于测量被试对词语书面形式的辨识程度,并且采用五点量表的统计方法让学习者进行主观评定。

沈禾玲(2009)采用学生自我评定的方式测试了美国高级汉语水平的学生对8500常用词汇的掌握程度。这8500常用词主要来自北京语言学院语言教学研究所1986年编写的《现代汉语频率词典》,选取其中的1%作为样本进行测试。试卷样本如下:

1.自己

I.Ihave no idea of this word.

II.Iam not sure if Iknow thisword,but Iguess ismeans____________(W rite out themeaning in English)

III.Iknow thisword,Itmeans___________(Write out themeaning in English)

IV.I can use thisword in a sentence___________(Write a sentence in Chinese)

在沈禾玲设计的测量问卷中,IV是让学习者用目标词写出一个句子,这实际是在测量学习者的产出性词汇的质量。所以这一测量是综合了理解性词汇量和产出性词汇量这两个指标。

综上所述,在词汇测量工具的研制和开发上,英语第二语言教学的起步较早,成果较为丰硕,在第二语言教学界的影响也相对较大。而汉语第二语言界的相关研究较为滞后,并且尚未出现公认的影响力较大的权威测量工具。

从第二语言教学界有关词汇量测量工具的形式来看,主要包括单选(Schmitt,2001)、词汇联想测试题(Read,1993、1995、1998)、完形填空(Laufer&Nation,1999)、翻译(钱旭菁,2002)、自我评定(张和生,2006)等。

在设计词汇测量工具的题型时,学者们都有自己的考虑,单选题是为了方便学习者进行选择,但对干扰项的设计要多加考虑。词汇联想测试题可以减少测量工具的长度,缩短测量所需的时间,降低学习者的焦虑和烦躁情绪。完形填空是为了测得有控制条件下的学习者的词汇量。翻译这一题型相对简单,问卷容易设计,但是在测量起来,容易出现学习者可能理解词的意思却不会表达的情况。自我评定类问卷的设计较为简单,但由于学习者的风格不同,所以容易出现过高或过低估计自己词汇量的情况。

从英语和汉语第二语言教学词汇量测量工具中目标词的来源来看,均来自常用词表,多数采取了分层抽样的方法,也有少数通过随机抽样得到。虽同为常用词表,每个词表内部所包含的词也不尽相同。此外,对词表的分级也不一致,有的以2000词汇、3000词汇、5000词汇为分级界限,有的以1000词汇为界限进行逐层分级。

三、第二语言词汇量测量结果的差异及原因分析

不少学者对国内英语第二语言学习者的词汇量进行了调查,测试结果差异较大。邓昭春,曾中平(1998)对本科涉外专业和非涉外专业学生的词汇量进行了调查,调查结果显示,入学时他们的平均词汇量分别为3500和3533个。邵华(2002)的测试显示普通高师院校学生的入学词汇量为2574个,二年级学期结束为3811个。吕长竑(2004)对西南地区重点理工科大学新生的词汇量进行了调查,结果显示他们的词汇量为2145个。崔艳鄢、王同顺(2006)调查发现英语专业学生的接受性词汇量一年级为3391个,四年级为7199个。

在汉语第二语言教学领域,钱旭菁(2002)以3000常用词为选词范围,运用释义法和翻译法测量了学习了一年半到两年半汉语的日本学生的词汇量,测量结果显示,这两种方法的测量结果分别为2750个和2169个。江新等(2004)对十余万字的“外国学生汉语作文语料库”进行了统计,分析了一至三年级以汉字文化圈为主的留学生作文用词情况。统计结果显示,各年级留学生使用的词语总量为3985个。因为语料库反映的是学习者笔语输出的情况,基于语料库的调查结果反映的是学习者的产出性词汇量。张和生(2006)统计结果显示,学习时间在25个月以上的学习者的词汇量约为3986个。沈禾玲(2009)测试了美国高级汉语水平的学生对8500常用词汇的掌握程度。调查结果显示,学习了三年的汉语学习者掌握的消极词汇的平均数量为2229个,其中最高的是5050个。学生掌握的积极词汇的平均数量为1314个,最高的数量为3400个。

以上研究的结果表明,第二语言教学界词汇测量的结果有时会有一定的差异,造成这些差异的原因大概有以下几个方面:

1.对词汇知识的认识不一

词汇知识包含哪些内容?Richards(1976),Nation(1990),Wesche&Paribakht(1996),Chap-pelle(1998),Henriksen(1999),Qian(1999)等学者先后提出了各不相同却又互补的理论框架。

目前学界普遍将词汇知识分为接受性词汇(receptive knowledge)和产出性词汇(productive knowledge)(Henricksen,1999;Melka,1997),也有人称作消极词汇和积极词汇(沈禾玲,2009),或认知型词汇和活用型词汇(吴丽君,2004)。接受性词汇是学习者能够辨识的词汇,而产出性词汇指学生在口语或书面语表达中能够使用的词汇。针对产出性词汇,Laufer和Nation又将其细分为控制性产出词汇和自由产出词汇。控制性产出词汇是学习者在受到任务刺激时可以产出的词汇,如单词造句或完形填空,这两种形式都在一定程度上给了被测者一种提示,因此是有控制的;自由产出词汇是在自由写作或谈话过程中学习者自主使用的词汇。

词汇知识还可以分为词汇广度知识和词汇深度知识。广度知识是指学习者词汇量的大小(Wesche&Paribakht,1996;Hazenberg&Hulstijn,1996)。深度知识(depth of knowledge)包括词的语音形式、文字形式、概念义、联想义、语法特点、搭配、语用等(Henricksen,1999;Read,1993;Wesche&Paribakht,1996)。

对于词汇深度知识到底包含哪些,不同的学者也有不同的观点。一种将词汇知识进行分类描述,如Cronbach(1942),Nation(1990),Laufer(1990,1993)等。他们认为一个词的词汇知识包括这个词的意义和用法的不同方面。Cronbach(1942)认为理解一个词包含下列五个含义:类化(generalization)(能给该词下定义)、应用(application)(选择该词的一个适当用法)、意义的宽度(breadth ofmeaning)(回忆该词的不同意义)、意义的准确度(precision ofmeaning)(在各种可能情形中正确地运用词义)以及易联想性(availability)(能产出性地使用词语)(Read,1997)。Nation(1990)认为,了解一个词意味着知道它的形式(口头和书面)、位置(语法句型、搭配)、功能(频率、得体性)和意义(概念、联想)(Laufer&Paribakht,1998)。另一种观点认为词汇的发展是连续的,如Dale (1965),Faerch等(1984),Palmberg(1987),Henriksen(1996)等。他们认为词汇知识是由不同水平和知识面组成的连续体,所调查到的词汇知识不过是词汇习得过程中某一特定阶段词汇知识的反映。如Faerch等(1984)认为这种词汇连续体的起点为对词形的模糊了解(即知道这个词是目标语中的一个词),终点为在自由产出中正确使用这个词的能力。而Dale(1965)将这个连续体分为五个阶段:I.我以前从未见过该词;II.我听说过该词,但不知道其含义;III.我在语境中认识它,它与……有关;IV.我知道该词;V.我能够把该词跟其它在意义上与其密切相关的词区别开来(Read,1997)。

桂诗春(1985)在介绍自己设计的词汇量测试工具时,曾客观地指出,这一调查只能测试学生对单词的基本意义的理解。有些人对某些词的基本意义不知道,然而懂得其次要意义。该调查无法反映这种情况。

学界对接受性词汇、产出性词汇、词汇广度知识的界定基本一致,对于词汇深度知识,我们认为,它是一个包含词的意义和用法的不同方面的连续体。词汇量的测试只能反映学习者在一定学习时期对词的意义和用法的掌握情况。

2.对词的定义不一

在进行英语词汇量测试时,一些学者把词的屈折形式、派生词和合成词分列为不同的词(邓昭春,1998),另外一些学者则将这些形式看作一个词。

Bauer和Nation(1993)认为一个基础词及其派生词和屈折形式构成一个词族。测量时应该以词族为单位统计词汇量。我们认为在英语中,词汇的派生词和屈折形式无需一一逐个学习,将其看作一个词族符合心理词汇的构成方式,也有助于词汇测量研究的标准化。

3.词汇量表中词的抽样方法、抽样数量、词汇来源不同

张和生(2006)设计的“留学生汉语词汇量测量表”,采用随机抽样的方法从《汉语水平词汇与汉字等级大纲》的甲乙丙丁四个等级的词汇中抽取,并加以人工干预。钱旭菁(2002)以《汉语水平词汇与汉字等级大纲》中的甲、乙两级词(3051个)为测量常用词的词汇范围,隔七选一进行等距抽样。前者最终抽取132个词汇样本,后者选取了300个词汇作为样本。

邓昭春、曾中平(1998)面向英语学习者的词汇量测量采用分层随机抽样的方法,从1000个常用词中抽取了200个样本进行测试。

关于词汇量表中词的来源,最常见的有两种,一是从第二语言的词汇大纲中抽样选取,二是从常用的词频统计表中抽取。常用的词频统计表基本上是根据母语者的词汇使用情况而做出的统计,面向第二语言学习者并非完全适用。第二语言教学的词汇大纲通常是建立在母语者的词汇频率统计的基础上,并考虑第二语言学习者的学习需要,加以人工干涉而编制的,更适合第二语言学习者的实际情况。

4.调查对象和时机不同

桂诗春(1985)与邓昭春、曾中平(1998)测试所采用的问卷完全相同,但是测量结果不同。因为桂诗春的测试是面向英语专业二年级和四年级进行的,而邓昭春、曾中平则是面向涉外专业和非涉外专业的学生入学时的水平进行的。

我们认为开展面向不同学习背景、不同水平的第二语言学习者的词汇量调查是十分有必要的,这对于我们了解和把握学习者在不同阶段的词汇习得情况,编制更为完善和科学的教学大纲是非常有益的。

词汇测量需要考虑的因素还有很多。所要测量的词汇量是理解性的还是产出性的?是口语的还是笔语的?测量中的词汇是独立的还是嵌入文本的?测量对象是在母语环境下学习的还是在目的语环境下学习的?这些都可能影响词汇测量的结果。在编制词汇量表时,这些都是应该考虑的因素。汉语第二语言的词汇测量刚刚起步,相关的研究还不够丰富,有关词汇测量的工具有待进一步开发。我们可以借鉴英语第二语言教学词汇测量的经验,开发出适合汉语第二语言的词汇测量工具。

大学英语教学大纲修订组《大学英语教学大纲(修订本)》,上海:上海外语教育出版社,1996年。

邓昭春、曾中平:《本科生英语词汇量调查与教学思考》,《外语与外语教学》,1998年第10期。

桂诗春编:《中国学生英语词汇量调查》,《公共外语教学研究文集》,上海:上海外语教育出版社,1983年。

吕长竑:《词汇量与语言综合能力、词汇深度知识之关系》,《外语教学与研究》,2004年第2期。

钱旭菁:《词汇量测试研究初探》,《世界汉语教学》,2002年第4期。

沈禾玲:《广度与深度——美国高年级学生词汇习得调查》,《世界汉语教学》,2009年第1期。

张和生:《外国学生汉语词汇学习状况计量研究》,《世界汉语教学》,2006年第1期。

Coxhead,A.A new academic word list,TESOLQuarterly,2000.34(2):213-238.

Henriksen,B.Three dimensions of vocabulary development.Studies in Second Language Acquisition,1999.21(3):303-317.

Laufer B.&Nation P.A vocabulary size testof controlled productive ability.Language Teating,1999.16,(1):33-51.

Laufer,B.&Nation,I.S.P.Vocabulary size and use:Lexical richness in L2 written production.Applied Linguistics,1995.16:307-22.

Laufer,B.The development of passive and active vocabulary in second language:Same or different?Applied Linguistics,1998.19:255-71.

Laufer,B.&Nation,I.S.P.Vocabulary size and use:Lexical richness in L2 written production.Applied Linguistics,1996.16 (3):307-322.

Nation,I.S.P.Testing and teaching vocabulary.Guideline,1983.5(1):12-25.

Nation,I.S.P.Teaching and Learning Vocabulary.New York:Newbury House Publishers.1990.

Nation,I.S.P.&Beglar.Vocabulary size test.The Language Teacher,2007.31:9-12.

Paribakht,T.S.&Wesche,M.Toward a lexical processingmodel for the study of second language vocabulary acquisition: Evidence from ESL reading.Studies in Second Language Acquisition,1997.19(3):309-329.

Qian,D.Investigating the relationship between vocabulary know ledge and academic reading performance:An assessment perspective.Language Learning,2002.52(3):513-536.

Read,J.Validating a test tomeasure depth of vocabulary knowledge.In A.Kunnan(ed.).Validation in Language Assessment.Mahwah,NJ:Lawrence Erlbaum,1998.41-60.

Read,J.The development of a new measure of L2 vocabulary knowledge.Language Testing,10(3):355-371.

Richards,J.The role of vocabulary teaching.TESOLQuarterly,1976.10(1):77-89.

Schmitt,N.,D.Schmitt&C.Clapham.Developmentand exploring the behavior of two new versions of the vocabulary levels test.Language Testing,2001.18(1):55-88.

Wesche,M.&T.Paribakht.S.Assessing second language vocabulary knowledge:depth versus breadth.Canadian Modern Language Review,1996.53(1):13-40.

Review on Vocabulary M easurement Instruments of Second Language

ZHANG Jiangli
(Beijing Chinese Language and Culture College,Beijing 102206 China)

Vocabulary quantity is an important index of reflecting the second language learners'language proficiency.This paper summarizes themeasuring instruments in teaching English as the second language and teaching Chinese as the second language,analyzes the reason of the difference between the results of vocabulary survey.We expect to provide a reference for better vocabulary measurement instruments.

vocabulary quantity;measurement instruments;second language learning

H195

:A

:2221-9056(2017)02-0277-08

10.14095/j.cnki.oce.2017.02.015

2015-11-14

张江丽,北京华文学院副教授,语言学及应用语言学专业博士,研究方向为汉语第二语言教学与习得。Email:zhangjiangli@huawen.edu.cn

本研究受到了2014年度国家社科基金青年项目“外国留学生汉语书面语词汇进步模式研究”(14CYY020)和北京

华文学院年度课题“基于语料库的华裔学习者词汇量调查研究”(HW-15-B01)的资助。

猜你喜欢
第二语言词汇量工具
波比的工具
波比的工具
第二语言语音习得中的误读
用词类活用法扩充词汇量
准备工具:步骤:
“巧用”工具
汉语作为第二语言学习需求研究述评
Improving Vocational School Students’ Ability of Speaking English by the PPP Model
Receptive and Productive Vocabulary in Language Teaching
词汇量测试对语言水平的预测性的实证研究