基于比较法视角下大学英语口语语料库的套语研究

2023-03-28 00:28董姝君
吉林农业科技学院学报 2023年1期
关键词:语料语料库英语专业

董姝君

(淮北师范大学外国语学院,淮北 235000)

随着科技的不断发展,互联网的应用越来越广泛,在互联网平台上运营的语料库内容也越来越多。基于对套语理论的推进,套语的地位和作用越来越突出,研究工作得到了语言界的高度重视。在英语口语以及书面用语中,人们对套语的使用越发频繁,因此其使用率不断增高。随着Wordsmith等软件的应用,从语料库中自动选择所需要的套语变成一件轻而易举的事情,套语在英语教学和写作中的重要性越来越突出,受到了人们的重视。而致谢语与道歉语均是套语口语中两种非常重要的口语,因此对于这两种套语口语的研究也越来越多[1-2]。

1 基本概念

1.1 语料库

语料库是指在海量的语料中,依照一定方法,合理选取一定数量的语料,构建一个大型电子语料文本库,该文本库比较特殊,就是具有非常丰富的词汇量。它借助互联网平台,利用计算机分析工具进行整理归类,供研究者和学习者提取使用或进行研究[3-4]。

1.2 套语

套语是现代英语中常见的一种多词汇情景。一般情况下,都是位于传统语法以及词汇两者之间,存在的形式是以固定或半固定,以及被按照一定规律模式化的块状结构。它通常有词汇短语、语块、预制语块、程式化语句四种称呼[5]。

1.3 口语语料库

口语语料库是建设在互联网平台上的收集语言、音频、文件和文字副本的大型数据库[6]。具体作用如图1所示。

图1 语料库作用

2 研究设计

2.1 研究方法

运用中间语对比分析法,对一定数量的中英两国大学生在口语语料库中对套语的使用范围和频率抽取一定的样本,然后进行对比研究。为保证结果的正确性和科学性,一般使用互联网计算机,对口语语料库中套语的被提取应用的周期数据进行整理、归纳、总结,并自动进行提取使用。同时要通过人工筛选的方式进行研究探讨。

2.2 套语的界定

套语其实就是一种词语片段,它需要具备三个特点。第一,结构上要相对完整;第二,整体上可以表达某种意义;第三,必须具有连续性[7-8]。在本研究中以口语语料库套语致谢语与道歉语为例,分析中英两国英语专业学生应用致谢语与道歉语的差异。

3 关于口语套语致谢语中比较分析

致谢其含意表示对他人感谢与感激之情的一种语言行为,是全球各国民众大部分共同遵循的一种礼仪。不过因为人们的价值观、传统思想观念与习俗不同,导致致谢的表达形式与范畴也存在较大差异。在现代人类语言学中,全球人类均是通过语言来进行交流,以便于达到交流思想的意图。比如感谢、批评、讽刺、道歉等均属于不同语言行为[9]。

据国外有关文献[10]研究中采用了Discourse complete task(DCT)研究方法与the Cambridge and Nottingham Corpus of Discourse in English(简称CANCODE)语料库比较研究,经过对16个英语本土族的DCT问卷调查研究,统计出使用频率较高的致谢套语。再将语料库进行比较研究,在该研究中列举了6种比较常用的致谢套语表现形式,具体见表1。

表1 6种不同类型致谢套语用于DCT与CANCOD语库料对比

3.1 语料库、搜索工具与措施概述

国内有关文献[11]构建了Spoken English Corpus of Chinese Learners(我国大学生口语套语语料库,英文简称为SECCL)以及Michigan Corpus of Academic Spoken English(英语本土语口语套语语料库,英文简称为MICASE)。从这两个语料库中进行抽样,大概为36 000词次。英国本土语料库抽样语料不管是在库容、话语模式,还是在语料提供者的年纪与学历等均与中国学生英语笔语语料库之口语语料库分库中的高水平学习者子库匹配度较佳。本文采用相关计算机软件对致谢语套语口语进行搜索、统计,并对其进行比较分析,把SECCL与MICASE两类语料库进行比较,再运用Log-likelihood 计算器进行两者差异检测,对中英两国学生对致谢套语学习情况进行研究。

3.2 搜索结果与分析

此文最早采用的套语频率检测来源于native speaker(使用母语的人)在DCT检测中所产生的高频率致谢套语,通过在我国语料库与英国本土语料库中所选择的语料进行检索,发现下列致谢套语在我国学生口语中,他们对“thanks”“Ta”“thanks a lot”这类套语应用不多,不过我国学生偏爱用“thank you”“thank you very much”。具体见表2、表3。

表2 MCASE与SECCL两大语料库致谢套语频率

表3 6大类型致谢套语模式比较研究

依照Log likelihood(最大似然估计计算器)的计算法则与结果表明,我国学生应用致谢套语模式2与模式6频率较高,但使用模式1与模式4频率较低。由此可知,我国学生在应用致谢套语模式呈现出比较单一的现象。例如:我国学生仅能简单应用“thank you”,而在口语中应用“thanks a lot”不多。

4 关于口语套语中的道歉语比较分析

4.1 研究问题提出

本文选择口语的excuse me,I apologia,以及I’m/am sorry这三个道歉短语作为研究对象,然后分别进行检索、比较,以便于对我国英语专业的学生和英国本土用语三个比较常用的道歉语应用特点与区别进行分析,主要研究问题:在不同的口语语料库中,我国英语专业学生与英国本土学生在应用这三个道歉语过程中的使用频率有什么差别;如果存在差别,它的原因是什么。

4.2 数据采集来源

本文基于语料库,运用KWIC检索方法,再借助于相关计算机软件,分别对所列举的三个道歉语在两个语料库产生的总频数、关联接以及语义应用进行剖析,此外,还利用中介语进行比较分析,以对3个道歉语应用差异原因进行探讨[12]。本文采用我国学生英语口语语料库SWECCL部分与BNC(英国本土口语语料库)的口语部分,SWECCL大概共计100万左右,采集了2007~2021年共15年的我国大学英语专业的学生口语考试语料;而BNC的口语部分占1 000万左右,包含了风格迥异与场景存在差异的真实语言数据。这两个语料库尽管在单词容量上不同,不过对两者相互比较并不会产生什么影响,能够把这3个道歉语在不一样的语料库中检索到频数标准化,将原始频数换算成标准频数,也就是每100万词中所出现频率。

4.3 数据分析

把3个道歉语作为节点词,再凭借相关计算机软件对SWECCL、BNC中的三个道歉语的频数进行具体描述剖析,剖析结果如表4所示。

表4 3个道歉语标准化频数统计

4.3.1 Excuse me应用对比分析 由表4可知,该道歉语在SEECCL中每100万频率为30.978万,低于英国本土BNC的100万频率为50.138万,这就表明Excuse me在英语本土语语料库应用更广泛、更常见。产生此类现象是因为英国本土学生能够在不同语境下均能熟练应用Excuse me各种用法。

4.3.2 I apologia应用对比分析 由表4可知,该道歉语在SECCL中每100万词频率为6,比英语本土语料库的每100万词频率4.897略高。英语本土学生在使用该道歉语时均是在比较正式公共机构、商务等场合下应用较多。产生这种现象是因为我国英语专业学生大部分没有全面掌握此道歉语的实际应用场景,在对其实际应用过程中,对该道歉语的适用性不太明确,语体意识不够强,导致我国英语专业学生在应用I apologia频率高于英国本土学生[13]。

4.3.3 I’m/am sorry应用比较分析 由表4可知,该道歉语在SECCL中每100万词语使用频率为126.002,高于BNC的英语本土语料库每100万词语使用频率为83.379,该现象产生的原因是因为“对不起”是汉语中通用型的道歉语,在很多场合都可以使用,因此其使用频率最高。此外,在大学英语专业课堂教学中,学生可能重复输入此道歉语的次数比较多,而且英语专业学生接触此道歉语比较早,应用较广泛,使得道歉语在实际应用过程中就显得比较简单,使用频率也高[14]。

5 结语

本文主要对中英两国英语专业学生应用致谢语与道歉语两种套语口语实际情况进行了研究,立足于套语、口语、语料库等相关概念基础上,运用比较分析法,借助计算机相关软件,基于中国与英国本土两个不同英语套语口语语料库,对致谢语与道歉语两种套语口语在中英两国英语专业学生应用中所表现的差异性进行研究。关于致谢语基于SWECCL与MICASE语料库,对中英两国英语专业学生应用致谢语的差异性进行研究,研究结果表明:我国学生对致谢套语模式2与模式6应用频率较高,但使用模式1与模式4频率较低,表明我国学习者在应用致谢套语模式呈现比较单一的现象。英语母语在应用致谢语过程中,非常重视他人感受,但我国学生能够正确应用模式4人员并不多。关于道歉语基于SWECCL与BNC两种数据库,选取了“excuse me”“I apologia”以及“I’m/am sorry”3个道歉语对中英两国英语专业学生应用道歉语差异性进行研究,结果表明:Excuse me在英语本土语语料库中应用更广泛、更常见。产生此类现象是因为英国本土民众能够在不同语境下均能熟练应用Excuse me的不同用法;I apologia在我国英语专业学生中应用频率高于英国本土学生,因为英语本土学生在使用该道歉语时均是在比较正式公共机构、商务等场合下应用较多;I’m/am sorry在我国英语专业学生中应用比较广泛,因为“对不起”是汉语中通用型的道歉语,在很多场合都可以使用。

猜你喜欢
语料语料库英语专业
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
“产出导向法”在英语专业写作教学中的应用
新时代下高职高专非英语专业写作教学改革之探索
华语电影作为真实语料在翻译教学中的应用
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
语料库语言学未来发展趋势
英语专业研究式学习的探索与思考