国际中文教育中典型程度副词的提取

2022-11-04 07:41巴里很拜提汗
现代语文 2022年10期
关键词:词频虚词范畴

张 舒,巴里很·拜提汗

(1.燕山大学 文法学院,河北 秦皇岛 066004;2.燕山大学 学生工作处,河北 秦皇岛 066004)

一、引言

杨吉春指出,国内外教学词表、词库研制,历来以词频为标准提取教学所需词汇;以词频编制的词表、词库存在抽象性词语的频率比具体性词语的频率高的现象,若仅按词汇出现频率的高低来编排词汇教学的先后顺序,违背人类认知事物从具体到抽象的客观认知规律,会降低学习效率[1]。既然仅靠词频来提取教学词汇具有一定的局限性,那么探索国际中文教育用词汇的其他标准就显得尤为必要。目前来看,以基本层次范畴理论为依据,提取汉语基本层次范畴词(以下简称“基层词”)是一种很有意义的探索。无论是依据词频,还是依据基本层次范畴理论的标准来提取词语,其初衷都是提取出最典型的词语用于国际中文教育。正如赵艳芳所指出的:“基本范畴是最典型的原型范畴,原型范畴在基本等级范畴得到最好的体现,频率高的词多是基本等级范畴词或在某一语言集团中较熟悉的词汇。”[2](P84-87)也就是说,尽管依凭词频和基本层次范畴理论是两种提取视角,但是二者并不矛盾,甚至还可以互相补充。杨吉春曾经指出:“基层词汇并不一定常用,常用的并不一定是基层词汇;常用基层词汇必须是基层词汇中的常用词汇。”[3]应当说,运用基本层次范畴理论来提取基层词,主张对外汉语词汇教学应以常用基本层次范畴词汇教学为中心[3],是词表研制以及词汇教学中的一项颇有价值的工作。因为依据基本层次范畴理论提取的词语,往往就是词汇系统中最典型的成员,这些最典型的成员理应在词表研制和词汇教学中最先得到重视。

从现有研究成果来看,运用基本层次范畴理论提取基层词这项工作,主要集中于提取具有实在意义的实词[1]、[3]-[7],对虚词的提取则很少涉及,这与该理论本身的适用性有关。基本层次范畴理论讲究范畴的层级性,其中,基本范畴词是表现感知和功能完形最高的词汇等级[2](P94),实词意义实在,范畴层次比较明晰。而由于虚词的主要功能是在于表达语法意义,其词汇意义相对空灵,不具备“完形”等特征,这就使得虚词的范畴层次并没有实词那么明晰。有鉴于此,本文不再提取基层虚词,而是主要提取典型虚词。由于词频不能作为唯一标准,而运用基本层次范畴理论所提出的“完形”等标准又不大适用,这就使得提取典型虚词的工作比较艰难。不过,汉语的虚词是词汇、语法教学的重点[8],同时,汉语词汇本来就包括实词和虚词两个部分,因此,在词表、词库的研制过程中,只有实词的提取标准而无虚词的提取标准,既是不合理的,也是不完整的。

本文从原型范畴理论的视角出发,审视国际中文教育中典型虚词的特点,并在此基础上探索适用于提取典型虚词的方法。可以说,依据原型范畴理论提取典型虚词和依据基本层次范畴理论提取实词中的基层词,在本质上是相通的。这是因为基本层次和原型范畴之间是共生关系,这种共生关系以两个原则为基础:一是原型范畴在基本层次上发展得最完全;二是基本层次范畴之所以具有原型范畴所具有的功能,是因为它们是像原型范畴那样构造的[9](P83)。基于原型范畴理论提取典型虚词,也可以克服唯词频为标准的弊病,它所提取的结果同样符合人们的认知规律,这是因为在一个范畴中,有中心成员和非中心成员之分[10](P17)。典型虚词无疑是虚词范畴中的中心成员,也是认知中最显著的成员。

根据朱德熙的分类体系,虚词主要包括副词、介词、连词、助词、叹词、拟声词等[11](P39-40)。本文拟以副词中的程度副词为例,来探索典型虚词的提取方法。以程度副词为例的理由有二:第一,相对于虚词中的其他词类,副词通常被认为是处于实词和虚词的过渡地带的词类,因此,若能成功提取典型副词,在一定程度上就可以厘清实词和虚词提取方法的异同,从而能为其他虚词的提取提供借鉴。第二,副词类型多样,在提取词语时,不可能照顾到所有的副词,所以应首先提取出各类型中的典型副词。由于程度副词不仅是汉语副词中非常重要又相当常用的一类,而且是汉语作为第二语言的学习者(以下简称“二语者”)较早接触的副词类型,因此,有必要优先开展典型程度副词的提取工作。

二、国际中文教育中典型程度副词的特点

齐沪扬等指出,从使用频率的角度将程度副词分为典型与非典型,对实际语法意义分析的帮助不大,并缺乏可操作性[12](P85)。该观点主要是从语法意义这一角度所作的评判,不过,如果是从国际中文教育的角度来考虑的话,对程度副词进行典型与非典型的区分还是很有必要的。因为习得是一个循序渐进的过程,初中级二语者优先习得一些较为典型的程度副词后,会逐渐加深对程度副词的认识,可为后期习得更多程度副词奠定基础。同时,齐文也再次启示我们:在提取典型程度副词时,只依靠使用频率是行不通的,还要继续探索其他相适宜的标准。国际中文教育中的典型程度副词需要满足两个条件:一是程度副词范畴中对外区别性特征最为显著的成员,二是最适合优先教授给初中级二语者的成员。总的来看,国际中文教育中典型程度副词的特点可以概括为常用性、通用性、词形简单、词性单一与习得顺序优先。

(一)常用性

国际中文教育中的典型程度副词应具有常用性。尽管词频不能作为提取典型词语的唯一标准,但它仍然是一个重要的标准,因为词频高的词语也往往会成为典型程度副词。比如,“稍①”“微⑥”在音节数目、表义功能方面基本相同,但在使用频率方面存在很大差异,在国家语委现代汉语平衡语料库(以下简称“平衡语料库”)中,它们出现的频次分别为626、33。相较而言,使用频率高的“稍①”的典型程度更高。

(二)通用性

国际中文教育中的典型程度副词应具备通用性。通用性和常用性并不是一个概念,通用性是就使用群体与使用场合而言,常用性是就使用频率而言。如作为地道的程度副词,“蛮”“贼”活跃于口语或方言中,使用频率较高,但是并不具备通用性,因为国际中文教育“宁教规范词语而不教地道词语”[1]。由为国际中文教育服务这一提取目标所决定,国际中文教育中的典型程度副词不包括以下几类:方言词,如“忒”;口语词,如“蛮”;书面语词,如“聊”;新流行的程度副词,如“暴”。

(三)词形简单

国际中文教育中典型程度副词的词形应比较简单。陈爱锋、郭继懋在选择基本副词时指出,复杂度低的词倾向为基本副词,而复杂度的重要判断标准是音节数目[13]。在苏新春主编的《现代汉语分类词典》(以下简称《分类词典》)中,程度副词共有259 个,这些程度副词的音节类型多样,具体可分为:单音节词、双音节词、三音节词和四音节词[14]。程度副词的音节类型分布如表1 所示:

表1 程度副词的音节类型分布统计

从表1 可以看出,在现代汉语中,三音节、四音节程度副词的比重之和为5.79%,单音节词占23.55%,双音节词占70.66%。作为程度副词中的典型成员,典型程度副词理应形式简单、音节较短,所以三音节、四音节的程度副词应该不属于典型程度副词。接下来的问题是:相较于双音节程度副词,单音节程度副词的词形更为简单,那么,它是否也更为典型呢?由于有些单音节程度副词的文言色彩浓厚,只能用于书面语言中,并且部分副词已经呈现出语素化的倾向[15](P20),因此,其典型性并不算高,如“愈、弥、殊、颇”。而“非常”“有点”等双音程度副词,由于使用频率和人们的熟悉程度较高,反而是较为典型的程度副词。同时,随着汉语词汇双音节化的趋势,有些单音节程度副词逐渐被同义的双音节副词所替代,这些程度副词不再常用。可见,单音节、双音节不再适合作为区分典型与否的主要依据。

(四)词性单一

国际中文教育中典型程度副词的词性应比较单一。由于汉语缺乏形态变化,同印欧语系的副词相比,汉语的副词是一种相当特殊的词类,其中的一个主要表现是副词的虚化程度不一[15](P3)。程度副词也不例外,其内部成员的虚化程度殊异,具体表现在:有的成员虚化程度较高,只有程度副词的用法,如“很”;有的成员虚化程度较低,程度副词的用法只是多个用法中的一个,如“老”;有的成员虚化程度更低,像有些新兴程度副词的用法还没有固化下来,如“怒”。在二语习得过程中,如果一个词语的词性过多,二语者可能就会混淆相关用法,就此而言,词性单一的程度副词应更为典型。

(五)习得顺序优先

通常情况下,典型程度副词能较早为儿童所习得。习得顺序的优先性体现了人们的认知规律,这是因为范畴的典型成员例子比非典型的成员的例子更容易学会[16](P209)。在运用基本层次范畴理论提取基层词时,以往的研究也注意到,习得顺序的优先性是基层词的一个重要标准。赵艳芳指出,在四五岁儿童掌握的语言中,80%为基本范畴等级词语[2](P59);李文婧也指出,相较一般动词而言,基层动词在儿童习得顺序上具有优先性[6]。相较于非典型程度副词来说,典型程度副词更能展示程度副词这一范畴最凸显的特征,具备更优质的成员资格,因此,也应该具备习得顺序的优先性。

与经典范畴理论有所不同,原型范畴理论认为,隶属于同一范畴的各成员之间不存在共享所有特征的现象[17](P100)。因此,隶属典型程度副词范畴的各个成员,也不是非要具备以上所有特点,只能说上述特点具备得越多,越接近为国际中文教育中的典型成员。比如,“特别”的词性并不单一,不过,因为它同时具备其他四项标准,所以也属于较为典型的程度副词。总之,国际中文教育中典型程度副词的提取工作比较复杂,理论与现实之间会存在一定矛盾,我们既不能固守教条,也不能简单化地“一刀切”,而是在参照五个特点的基础上,平衡各项之间的关系,以达到提取的客观性、科学性。

三、国际中文教育中典型程度副词的提取方法

上文主要是从理论层面对典型程度副词应具备的特点进行了探讨,那么,如何从理论层面落实到实践层面,让提取工作具备可操作性呢?本文采用了客观提取和主观验证相结合的研究方法。客观提取采用词典调查、语料库验证和相关成果相辅佐的方法,主观验证则采用问卷调查法。

(一)客观提取

本研究首先选取《分类词典》[14]作为语料来源。选取该词典的原因是在于:它建构了一个词量庞大、覆盖面广、层次清楚、分类合理的词汇分类体系。对于程度副词,它并不是零星举例,而是几乎涵盖了现代汉语所有的程度副词。同时,《分类词典》将程度副词分为五类,有利于在提取典型成员时兼顾各个次类,做到提取的全面性。下面,我们将具体演示客观提取典型程度副词时的操作方法和步骤。

1.在通用性这一标准方面,本文主要依据《现代汉语词典(第7 版)》(以下简称《现汉》)[18],对《分类词典》中的259 个程度副词进行了查检,剔除了《现汉》未收录、未标副词词性以及标注〈方〉〈书〉〈口〉的词语,这样一来,就剩下149 个备选词。以《现汉》为参照确立通用词标准的原因是在于:《现汉》是以记录普通话语汇为主的中型词典,作为一部权威辞书,其收词能够基本反映现代汉语词汇的基本面貌。通过观察该步骤所剔除和余留的词语,可以发现,形式简单、音节较短的确是典型程度副词的重要特点,《分类词典》中的三音节、四音节程度副词共有15 个,都未被《现汉》收录。

2.在常用性这一标准方面,本文以《现代汉语常用词表(草案)》(以下简称《常用词表》)的频次号为参照[19],对149 个词语的频次号进行了检索。本文提取副词的目的是为国际中文教育服务,《汉语国际教育用音节汉字词汇等级划分》指出:“在目前阶段,世界各地国际汉语教学的中心任务是普及。”[20](使用说明,P2)同时,《汉语国际教育用音节汉字词汇等级划分》所收词目共11092 条,因此,我们以《常用词表》中的频次号11092 为界,只保留了频次号11092 以内的67个词语。其中,频次序号越底,使用频率越高。具体如表2 所示:

表2 备选词在《常用词表》中的频次号统计

表2中所呈现的频次号只是代表整词的使用频率,并不能代表其作为程度副词时的使用频率。比如,“大”的频次号最低,使用频率最高,但这并不说明“大”一定是典型程度副词。因为“大”的词性不一,义项多样。鉴于兼类词的存在,我们在平衡语料库中检索了这67 个词语作为副词时的词频。选择平衡语料库的原因是在于:该语料库在线提供检索的语料经过分词和词性标注,这对统计程度副词的频次具有重要的参考价值。其中,频次数目越小,使用频率越低。67个备选词的具体频次,如表3 所示:

表3 备选词在现代汉语平衡语料库中的频次统计

综合表2、表3 的数据,可以发现,对于兼类词而言,整词词频使用较高,并不能说明其作为程度副词时的词频也高。如“小、深、生、穷”等,在表2的频次号都比较低,说明整词的词频较高;不过,它们的副词用法在语料库中的词频并不高,说明这些词语作为程度副词使用的机会较低。表3 以频次500 为界,将程度副词分为两组,相较而言,后一组29 个程度副词的使用频率较高,成为典型程度副词的可能性更大。

3.在词性相对单一这一标准立面,本文依据《现汉》,对这67 个词语的词性逐一查检。其中,只标注副词的词语共有23 个,它们分别是:很、更、最、再、十分、越、极、更加、几乎、尤其、愈、稍、格外、极其、较为、最为、尤、有点儿、尤为、大为、稍稍、全然、万分①在对词性进行统计时,有两点需要说明:第一,不成词语素的词性未在统计范围内,如“最”有两个义项,《现汉》并未对义项②“指(在同类事物中)居首位的;没有能比得上的”标注词性,说明该义项不单独使用,为不成词语素,故未纳入统计。第二,表示姓氏义项的词性未纳入统计,如“愈”的义项②为姓,该义项的词性也未作统计。。

在操作步骤一中,我们并未直接利用《现汉》对词性进行筛检,这主要是考虑到:词性的单一性是着眼于二语者的习得效果的,一个词语的词性过多,可能会干扰二语者对程度副词用法的习得,不过,这并不意味着兼类词一定不是典型程度副词。比如,兼类词“好”在作为程度副词时,其典型性程度是否就会比词性单一的“万分”低。这里暂且不下结论。本文对此采取的处理策略是:在步骤二所确定的29 个词语的基础上,再增加步骤三所确定的词性单一的副词,这样备选词就增至39 个。

4.在习得顺序优先这一标准方面,本文主要依据儿童习得程度副词的相关研究成果,来提取典型程度副词。习得顺序优先在一定程度上可以平衡词频与词性单一这两个标准之间的关系。因为儿童在习得程度副词时,并不是按照某个词语词性的多寡来习得的,凡是典型程度副词都可能会被优先习得。关于儿童习得程度副词的研究成果,目前见到的主要有三项:周国光的《儿童习得副词的偏向性特点》[21]、孔令达和傅满义的《儿童语言中副词的发展》[22]、张云秋和赵学彬的《早期儿童副词习得的优先序列——北京话早期儿童副词习得个案研究》[23]。这三项研究所确定的儿童较早习得的程度副词有所不同,具体如表4 所示:

表4 儿童较早习得的程度副词统计

综合以上研究成果,在39 个备选词的基础上,又增添了8 个词语:老、死、还、真、差点儿、快要、快、稍微,这样一来,备选典型程度副词共计47 个,它们是:挺、极其、稍、好、不过、大、相当、尤其、多么、有点儿、全、更加、根本、竟、多、几乎、完全、非常、极、越、太、十分、比较、特别、较、最、再、更、很、愈、格外、较为、最为、尤、尤为、大为、稍稍、全然、万分、老、死、还、真、差点儿、快要、快、稍微。需要说明的是,在《现汉》中,未收录“不太”,未为“透”列副词义项,“蛮”标注为方言词,因此,这些词语都未被纳入备选词之列。我们不仅要关注儿童会较早习得一些非典型的程度副词这种现象,还要探究产生这一现象背后的原因。因为儿童语言习得毕竟不等于二语习得,汉语为母语的儿童生活在地道的汉语文化圈,所以他们也会较早习得一些地道的口语词和方言词,而这些词语未必是适用于国际中文教育的典型程度副词。

在操作步骤二、三、四中,本文选择了各个步骤提取结果的并集而非交集,主要原因是在于:范畴成员之间以家族相似性的原则组织起来,每个成员与家族的其他成员共享一项或数项特征,几乎没有一项特征是所有成员所共享的。典型程度副词的提取也不例外,满足上述的特征越多,说明它越典型。同时,如果是该词语不具备某一特征的话,并不能说明它一定不典型。

(二)主观验证

典型程度副词的确定是一个由客观提取到主观验证的完整过程。验证环节不可或缺,因为客观提取的结果不一定是人们心目中最典型的程度副词。因此,本研究还采用了主观验证的方法,从客观提取的备选词中,确定语言使用者心目中真正的典型程度副词。我们邀请了141 名汉语为母语的语言学背景的研究生,对47 个词语的典型度分别进行评定。评定采用李克特五度量表,其中,1 表示完全不典型,2 表示比较不典型,3 表示中等,4 表示比较典型,5 表示非常典型。同时,由于我们的提取目的是为国际中文教育服务,口语、书面语色彩过于浓厚的程度副词也不宜于优先教授给二语者,因此,我们还请被试对47 个词语的语体色彩进行了评定。其中,1 表示完全是口语词,2 表示比较像口语词,3 表示中等,4 表示比较像书面语词,5 表示完全是书面语词。

本次的调查问卷形式如下:

此调查为匿名调查,您的回答无关对错。在答题的过程中,请不要使用手机、词典或询问他人。我们希望获得您的真实想法,并保证对您的回答严格保密。本问卷除用于研究外,不会用于他用。

您的专业:A 语言学相关专业 B 其他

1.您认为,“非常”是程度副词吗?

您认为,“非常”当作程度副词时,是用于口语,还是书面语?

通过SPSS23.0 软件,对问卷结果进行统计分析,备选典型程度副词的平均分、标准差如表5 所示:

表5 备选典型程度副词的平均分和标准差统计

在典型程度的评定方面,低于平均分的词语有20个,它们分别是:尤其、不过、大、真、全然、越、死、尤、大为、差点儿、快要、快、根本、老、多、竟、全、再、还、好。在语体色彩的评定方面,分数在平均分±标准差之外的词语有14 个,它们分别是:极其、全然、万分、死、尤、差点儿、快要、尤为、最为、较为、老、愈、格外、好。也就是说,典型程度得分在平均分以下、语体色彩分数在平均分±标准差之外的词语共有27 个。剩余的20 个词语分别是:非常、稍微、稍、十分、几乎、太、更加、更、特别、最、挺、相当、较、完全、多么、比较、极、很、稍稍、有点儿。这20 个程度副词在典型程度方面得分较高,在语体色彩方面也更接近平均分。

为了进一步考察这两组词语是否达到统计学的显著标准,笔者对它们分别进行了独立样本t 检验。在典型程度方面,剩余20 个程度副词(M =4.34,SD=0.24)的分数要显著高于另外27 个程度副词(M=3.37,SD =0.70)的分数,t(47)=5.59,p <0.01。对这两组词语进行比较,可以发现,剩余的20个词语的确合乎典型程度副词的要求:词形比较简单,词性相对单一,使用频率较高,语体色彩偏于中性,为儿童语言较早习得。主观验证的结果一方面体现了客观提取标准的可靠性,另一方面也说明了原型范畴理论对提取典型程度副词的适用性。对有些程度副词而言,可能不具备某个特点,但它仍然是人们心目中的典型程度副词,如“特别”词性多样,但它依然是典型程度副词。

总之,通过客观提取和主观验证相结合的方法,本文提取出国际中文教育用的20 个典型程度副词。从《分类词典》对程度副词所划分的类型来看,这20个典型程度副词分别属于五种类型:稍微类、比较类、非常类、完全/极类、过分类。其具体分布如表6 所示:

表6 典型程度副词的语义类型分布

四、结语

综上所述,在提取国际中文教育中各类虚词的典型成员时,我们面临着两大难题:一是词频不能作为唯一的标准,二是运用基本层次范畴理论所确立的提取标准又不适用。那么,如何来解决上述难题呢?本文以程度副词的提取为例,从原型范畴理论出发,首先确立国际中文教育中典型程度副词所具备的主要特点。然后,运用客观提取和主观验证相结合的方法,提取出20 个国际中文教育中的典型程度副词。当然,这并不意味着教学中只讲授这20 个程度副词,其他的程度副词不教不学,也不意味着只有在教完这些程度副词以后,才能讲授其他程度副词。对外汉语教学是一个循序渐进的过程,如果是二语者已对某种类型的程度副词具有较深的认识,则后续的教学中就可以教授同一类型的其他成员。比如,二语者在习得“很、挺、真”等高程度副词之后,再遇到“多、大”等程度副词时,学习者应该能够理解它们表示程度深的语义功能,只是汉语教师需要点拨词与词之间的差异,防止二语者混淆它们的用法。

典型虚词的提取不仅对国际中文教学意义重大,对词表研制也颇有价值。当前阶段,适用于国际中文教育和义务教育阶段语文教学的词表都在研制中,虚词作为词表中不可或缺的重要组成部分,其提取标准的确立及制定不容忽视。在一个合理而科学的词表中,每类词语的提取都要有周密而合理的标准,否则,任何一个环节的疏忽都会大大降低词表的可信度。从目前词表的研制来看,有关虚词的提取标准仍相当匮乏。本文也只是以典型程度副词的提取为例,对典型虚词提取进行了尝试性的探讨,其确立的标准与方法是否适用于其他副词乃至虚词的提取,还有待今后的研究予以验证。总之,学界应聚焦虚词提取的关键环节,精准发力,持续攻关,为典型虚词的提取确立行之有效的科学标准,以切实提高词表的信度和教学的效率。

猜你喜欢
词频虚词范畴
中国美学“气韵”范畴之“韵”探颐
高中文言文教学中如何把握“虚词于构句达意之作用”
语文阅读教育中的三对重要范畴辨正
词汇习得中的词频效应研究
汉语阅读中词频与注视时间、跳读的关系
Note from the Editor-in-Chief
词频,一部隐秘的历史
汉语依凭介词的语义范畴
试论对外汉语虚词教学
汉语音节累积词频对同音字听觉词汇表征的激活作用*