计量语言学研究现状与展望

2022-11-30 03:43何梦宇
关键词:学术论文语言学语料库

何梦宇

(澳门科技大学 国际学院,澳门 999078)

计量语言学是语言学的一个分支学科。计量语言学研究思想的起源可追溯到传统的语文学阶段,在这一时期就有学者运用计量语言学的方法来对语言进行研究,如:词频、字数统计分析等。具有现代意义的计量语言学诞生于20世纪初期,至今仅有不到百年的历史。计量语言学在科学与哲学基础、理论技术应用等方面都具有现代性。计量语言学以产生于真实语言活动中的语言材料为研究对象,使用定量的研究方法对语言的结构、模式和规律进行探索,是一个运用精确的方法来研究人类语言学分支的学科。“精确、真实、动态”被视为计量语言学的三大特点。

我国计量语言学起步较晚,从2010年起才逐渐有学者开始对计量语言学进行相关的研究。

虽起步较晚,但近些年来越来越多学者开始使用计量的方法进行语言研究。目前国内对计量语言学研究现状及其研究成果进行归纳和总结的综述类文章较少,同时也还未有学者将计量语言学与语料库语言学相结合进行研究。因此,笔者对国内公开发表的与计量语言学相关的学术论文进行统计和分析,归纳出该领域的研究热点,并对其未来发展趋势进行展望。同时将计量语言学与语料库语言学进行对比,进一步总结出计量语言学的研究特点与发展趋势。

一、研究设计与研究思路

(一)研究方法

笔者使用文献计量法和内容分析法两种研究方法对相关文献进行统计和分析。文献计量法是指以各种文献外部特征为研究对象的量化分析方法,内容分析法虽然本质上也属于文献计量学方法,但与文献计量法的区别在于内容分析法从定性的研究视角出发,采用定量的统计分析工具对研究对象进行处理,通过分析统计数据,进而得出相关的定性结论,不仅可以对文献的内容进行梳理,而且可以帮助我们对该领域的发展趋势进行预测。内容分析法的操作步骤为,先抽取有代表性的资料样本,随即将资料内容分解为一系列的分析单元,并按预先制定好的分析类别和纬度系统严格地进行评判记录,最终对结果进行统计分析。

(二)研究资料来源

笔者选取2010—2020年发表在中国知网与计量语言学相关的学术论文为研究资料。(2010年前国内发表的与计量语言学领域相关的学术论文较少,仅有2篇,且年份较早,因此2010年之前的文献不作为本文的研究样本)。笔者将“计量语言学”作为主题在中国知网搜索栏中进行检索,共检索到文献60篇,其中学术论文33篇。通过阅读文献的题目、关键词、摘要来确定该文章是否属于计量语言学研究范畴,若无法从这些信息中确定该文章的主题,则对原文进行阅读和分析,从而进行判断。经过阅读,剔除与计量语言学无明显关联的文献13篇,得到符合研究主题的相关文献共计20篇。

二、数据分析

(一)文献计量分析

进行统计后发现,与计量语言学相关的这20篇学术论文在2010—2020年的分布情况为:2010年0篇;2011年1篇;2012、2013年均为2篇;2014—2016年均为1篇;2017年3篇;2018年1篇;2019年2篇;2020年5篇。该领域学术论文在这10年间虽呈现上升趋势,但文献在总量上依然存在较少的问题。

(二)内容分析

笔者主要从研究内容和发表时间两个维度,对国内近10年来与计量语言学相关的学术论文进行统计和分析。笔者将研究内容分为:语音、语义、词汇、文本、类型学、协同语言学、理论介绍、综述和其他9个主题。其中,其他是指文章中融合了多个学科的研究,或文章涉及了计量语言学多个方面的研究。

1.计量语言学与语音研究

目前国内关于计量语言学语音方面的学术论文处于空缺状态。笔者认为,国内学者可以对汉语口语中的重音或其他发音情况进行思考,譬如方言发音等,提出有价值的假设并运用计量语言学的方法对假设做出相应的研究和证明。

2.计量语言学与语义研究

目前国内有关计量语言学语义方面的研究与语音方面的研究有相似的处境,这一情况同样应该引起学者们的高度的重视。学者们应将目光投入到计量语言学语义研究的方向中来,提出相关研究问题。如:意义和频率、动词和名词的多义词、语义分割空间等都是语义研究中的重要议题。国内目前在该研究领域的空缺状态对学者来说即是挑战也是机遇,研究者可阅读国外的相关文献和书籍,在前人的方法和理论基础上提出与汉语相关的计量语言学语义方面的研究问题,还可将汉语的语义问题与其他语言的语义问题进行对比。这不仅有利于我们对汉语语义进行更深层次地研究,还可以帮助我们更深入地理解汉语语义所具有的特殊性和普遍性。

本文使用n型〈100〉 Cz硅片(400 μm,1~10 Ωcm)制备Gr/Si太阳能电池.首先使用紫外/臭氧清洗机处理15 min去除硅表面沾污;然后在去离子水中超声清洗5 min.用稀释的氢氟酸(2%)去浸泡硅片,除去表面较厚的氧化层,用去离子水洗净,最后用氮气吹干.对上述去除氧化层的硅片静置1.5 h使硅表面形成一层薄的自然氧化层(SiOx).

3.计量语言学与词汇研究

目前国内关于计量语言学词汇方面的学术论文在2013年前仅有1篇,而在此之后的6年里该领域的学术论文数量一直为0。2020年该情况有所改善,在这一年内先后有4篇学术论文问世。其中有3篇都与学习者相关。如:李姝雯、邢红兵通过考察文本中常用词和非常用词在不同年级学生作文中的分布,进而寻找符合汉语特点的书面表达词汇发展的新测量参数[1]。虽然计量语言学词汇方面的总发文数量依然不多,但在一定程度上表明学者们已经提高了对该领域的关注度。

4.计量语言学与文本研究

计量语言学文本方面的学术论文发文量相对多于其他方面研究的发文量。自2014年来(2018年除外),与文本相关的研究每年都维持在1—2篇。2017年发表的2篇文章都与文本中词汇的频率研究相关。如:张晓瑾、刘海涛采用计量语言学的方法对中国民歌“花儿”(中国西北地区一种古老的民间歌谣)的文本特征进行研究,利用Zipf定律考察了中国“花儿”的词语频率分布,对中国“花儿”文本的“内在程式机制”进行验证[2]。值得一提的是与文本相关的这几篇学术论文大多都是将语料库和计量语言学研究方法相结合的实际应用研究,如:蒋跃基于语料库和计量语言学方法,获取人工译本和机器在线译本的语言结构的计量特征,从翻译风格、翻译质量等实际应用方面将人工翻译与机器在线翻译进行对比[3]。这些研究从一定程度上反映出了目前国内计量语言学研究领域的趋势和走向,即将计量方法与其他研究方法相结合的语言实际应用方面的研究。

5.计量语言学与类型学研究

目前国内有关计量语言学类型学方面的研究与语音、语义方面的研究有着相似的处境,2010—2020年,国内在类型学方面发表的学术论文为0篇。类型学的研究问题主要包括:“熵”和语言的粘着性、词素长度、语言的粘着性等。这些研究问题对于语言研究的发展有着至关重要的作用,因此学者们应给予该研究领域更多的关注。

目前国内在计量语言学协同语言学方面的学术论文仅有2篇。夏慧言、孙凤兰探究了协同语言学中的汉语词长和多义度的问题。她们以《英国国家语料库》为基础,采用计量语言学的方法,探讨了英语词长和词汇意义之间的关系,进而验证了相关理论假设和数学模型[4]。邓耀臣、冯志伟以语料库为基础,以协同语言学理论为指导,对汉语词汇长度与词汇在语篇中的使用频数之间的关系进行计量语言学分析[5]。这两篇文献同样也是将语料库和计量语言学方法相结合,进行协同语言学研究。

7.计量语言学与理论介绍

目前国内对计量语言学理论介绍的文献数量较少,在2010—2020这10年间仅有2篇文章介绍了计量语言学的理论和方法。冯志伟在文章中描述了计量语言学在语言科学中的地位,并介绍了计量语言学中的相关定律。如:分布定律、函数定律、演化定律等[6]。刘海涛、黄伟对计量语言学的发展历史、理论和方法进行了介绍与分析,梳理了该学科进一步发展的方向[7]。国内与计量语言学理论介绍相关的学术论文发表的时间都较早,那时学术界对计量语言学的重视程度还不够高,国内几乎还没有关于计量语言学的研究。这2篇文章旨在引起学界对该语言分支学科的重视,并呼吁相关研究者尽快投身到汉语计量语言学研究的领域中来。

8.计量语言学与文献综述研究

在2010—2020这10年间,国内与计量语言学相关的文献综述研究仅有1篇。王永、李昊天、刘海涛对俄罗斯计量语言学的发展历史、路径进行了详细的梳理,并介绍了俄罗斯计量语言学家的主要研究领域及其学术贡献[8]。而目前国内还没有学者对我国计量语言学的发展路径及研究现状进行梳理,因此,本研究期望能起到弥补该领域空白的作用。

9.计量语言学与其他研究

胡玉宁、朱学芳从计量语言学视域出发,对科学知识系统中的语言分布规律进行描述,并选择相关语料进行验证,旨在深化情报检索语言的理论和应用研究[9]。通过梳理相关文献发现,与其他学科相互交叉融合研究是目前计量语言学研究领域的趋势之一,该趋势有助于进一步发现语言的结构与演变规律,从而促进语言学的科学化发展。

三、计量语言学与语料库语言学的对比

近年来,学术研究的边界随着科学技术的不断进步而得到了快速的开拓和优化。在语言学研究中借助现代信息技术的力量来拓展研究成为一种常态和趋势。因此,语料库语言学在近些年的语言研究中越来越成了学者常用的研究方法之一。它与语言研究中的其他学科,如“语法学”“语义学”不同,不属于语言自身某个侧面的研究,而是与语料库语言学一样,同为语言研究方法,并且二者在研究中往往可以起到相辅相成的作用。正如上文中所提到的,近年来,在计量语言学研究领域中越来越多研究者将计量语言学与语料库语言学研究方法相结合,通过语料库收集相关研究信息,再运用计量的研究方法将信息进行量化研究。借助语料库,研究者可以收集到更多的语言现象,从而拓宽计量语言学的研究空间和路线,因此我们认为,这也将是未来计量语言学的发展趋势之一。

四、结语

根据上述内容,笔者得出以下结论:

国内对计量语言学的研究起步较晚,2010年才逐渐有学者开始对该领域进行相关的研究。且截至目前我国在计量语言学语音、语义、类型学方面所发表的学术论文依然很少。这一情况应引起相关学者的高度重视,我们应不断吸收、借鉴其他国家计量语言学研究的理论和方法,将其运用到中文语言现象的研究当中。

根据统计分析的结果发现,目前我国与计量语言学相关的学术论文数目虽然不多,但已经有缓慢上升的趋势。这是一个很好的现象。刘海涛、黄伟在汉语计量语言学现状描述中表示,截至2012年,国内与语言计量相关的方法或研究内容大部分都停留在字频统计层面[7]。而通过上述的整理和分析不难发现,在过去的8年里,我国计量语言学的研究领域已从自频统计逐步拓展到了语言研究的其他方面,甚至出现了与其他学科交叉融合的实际应用方面的研究。

计量语言学的研究热点目前集中在词汇、文本方面。根据上述统计和分析结果,可大致推断计量语言学与语料库语言学研究方法相结合的实际应用将是未来该研究领域的趋势之一。

尽管中国知网的权威性很高,但不可否认收集到的数据在一定程度上具有滞后性,同时数据也存在缺漏的可能。本研究旨在通过分析国内近10年以来与计量语言学研究有关的学术论文,从而对我国计量语言学的研究内容、趋势和热点有更清晰的了解和认识。上述分析和结论难免存在一些不足之处,但仍期望能对我国计量语言学领域的发展贡献绵薄之力。

猜你喜欢
学术论文语言学语料库
本期主要学术论文英文题目及摘要
学术论文征集启示
学术论文征集启事
基于语料库的清末民初日源外来词汉化研究
语言学研究的多元化趋势分析
美国现代语言学会版《〈红楼梦〉教学法》:要览与反思
运用语料库辅助高中英语写作
书讯《百年中国语言学思想史》出版
The Influence of Memetics for Language Spread
语料库与译者培养探索