汉语语料库在法律语言中的构建研究

2019-03-22 06:42李小亚
创新创业理论研究与实践 2019年22期
关键词:建库语料语言学

李小亚

(广西民族大学相思湖学院,广西南宁 530001)

法律语言学本身是一项交叉性较强的学科,自诞生成为独立的学科以来它便由于实用性和实践性较强而成为备受关注和使用的应用工具之一。从我国现阶段的发展状况来看,我国相关专业领域对于法律语言学的研究已经从传统的理论研究转向实用性更强的应用研究当中,由于从理论向实践的跨越本身需要很多改变,因此主观性较强的研究手法便不适用于这类研究,法律实践应用性目的的实现还要依靠现实证明和量化当中去,更多依靠的是理性主义和客观的精神,结合过往实践中所积累的经验来对法律语言学进行有效探究。结合语料库的建设特点,该文通过对其构建的理论基础、使用方法、技术使用、分类特点这4 个角度进行探讨。

1 汉语语料库构建的理论基础

1.1 社会属性

由于法律语言学具有一定的社会实用性,因此在汉语语料库的构建中其理论基础必不可少的会涉及对社会语言的使用。语料库的实际研究过程中,它更加侧重于一种按照从上到下的方法来研究,将语言对象作为一种社会类型的现象来分析,通过社会交际和实际发生的语言进行综合分析,因而法律语言在这一基础上也具有一定的社会属性,汉语语料库在构建过程中也应当贴合法律的语言交际,将其的形成与改变进行综合。

1.2 应用属性

语言已经从传统的理论层面的研究转向了应用层面的研究,研究者也更加关注语言知识和相关成果对现实问题的解决作用性。法律语言作为应用属性较强的项目,其发展过程要充分立足于实际,并将其的应用发展过程上升到理论的认识和总结,并回归于法律实践的过程中,让法律语言在实践中不断完善自身的建设,保证语言的事实性、理论性、客观性。语料库在实际的运用中也应当通过结合现实的方法和描写来对语言现象进行总结,并应用于法律语言之中。

1.3 客观性

法律本身的客观性、科学性、公正性等要求不同的司法环节必须树立严格的工作态度,法律语言学亦不例外。因此,在语料库的构建时期,必须对语言的运用和解释等工作进行科学性的研究,在涉及文本、语音、语言的使用过程中,也必须对语料的运用和发展奠定基础,在引用科学的数据分析上来对归纳性进行总结,使其更具科学性和客观性。

2 汉语语料库构建的研究方法

2.1 建库

汉语语料库针对法律部分的建库是基础性的工作。在该过程中,前期的语料素材采集、规划存储、分类构建、管理归属等都是根据不同的语言特点来进行的。从实际的法律语言特点来看,语料库的建库要采取语料附码、对原始文本的理论构建,并严格遵循语料采集的原则,在分类处理的前提下对取料原则进行分析,并保持其时效性和平衡性。

2.2 加工

对法律语料的加工重在对语料整体的分析当中。从实际的加工程序和步骤来看,主要有检索、统计、标注、语义分析等,在这一过程中要充分对语料进行索引分析,在语法、词汇的充分运用的基础上来对语篇资料进行整体的加工编著[4]。除此以外,语料库语言的研究充分利用区分法和驱动法,在附码软件的使用下来对法律语言中出现的词汇和语义等的词表使用频率进行表示,并进行延伸的词汇检索、索引、排除歧义等的调查使用。

2.3 分析

在语料库的分析过程中,其语料的使用合理性在于对语境和功能的调查分析。在不同的分析条件下,通过定量分析和定性分析进行有效检验,从而保证法律语料分析的事实性和客观性[5]。在分析技术的使用过程中,数据挖掘技术的使用对于语料分析来说有着十分重要的作用,在海量的离散数据经过技术分析后将知识进行精炼化。由于语料本身具有一定的脱离性,它们远离原有的语境,因此在研究过程中必须正视其客观性、事实性。

3 汉语语料库构建的问题分析

3.1 局限性分析

法律语料库在构建过程中不可忽视地具有一定的局限性。从其本身的使用特征来看,主要有时间上的局限性和建库方式的局限性。从时间上来看,由于本身建库的侧重点的目的不同,法律语料库在不同的时代特征上有着不同的特点,因此在时间上很难把握实际的度量;从建库方式来看,由于法律语料获取的方式较为单一,法律语料库在实际的庭审过程中的运用缺失精准性,这就是因为其转录和标注的技术不够精准。

3.2 加工过程分析

法律语料的加工困难重重。首先就是对语料本身所具有的含义的理解,由于语料库上的语言脱离原本的语境容易引起歧义,因此在国家标准的分词规范下这一加工过程得到了一定的缓解。在对检索平台和标准的使用基础上能够对字词和句子进行检索,平台搭建的困难性也正是体现在此。

3.3 应用分析

法律语料在实际的运用当中会考虑到很多分析因素,诸如对不同统计方式的思考,对原有语境的思考,对语料的离散程度的思考等,这些都是影响法律语料在实际应用中的精准性和科学的因素[7]。基于此,在实际的应用分析中应采取不同的方法来对其进行检验,对不同的变量因素和程度进行综合考量,在研究的基础上通过实践来验证其正确性和可行性,由此来提高信息的正确度和可信度。从根本上来看,法律语料库所提供的应用类型是对语言事实的反映,缺少对社会语境信息的分析。在这一基础上,必须对社会语言学等学科进行充分利用。

4 汉语语料库的分类构建

4.1 法律法规

法律法规的语料库构建是针对不同国家的法律法规、国际社会上所使用国际条约、不同行政区域所使用的规章制度和各级地方的司法解释等的文件。法律法规语料库的应用在这一类别具有法律效力,因此在分类构建中必须正视不同语句使用的科学性和标准化,尽量减少因语料库使用不当或者因法律条文语句的歧义、漏洞等所产生的语言不规范的现象。

4.2 专用文书

专用文书也是司法文书语料库。在该类型的语料库构建过程中是具有特定语言领域的,这类文书的使用主要针对案件处理的不同环节进行使用的,比如:侦查阶段、检察机关使用阶段、审判环节过程中等都会运用到的专用文书语料库。在该类型的语料库中,主要运用到的是以句子和篇章为主,司法文书的使用对于语言结构和语体等都有严格的要求,根据不同的刑事案件、民事案件、行政案件等都有不同的用途。

4.3 司法鉴定

司法鉴定语料库的构建主要应用在口语和文本的鉴定识别过程中。在实际的实践过程中,由于语料库本身是针对文本作者识别使用,因此在搜集和整理的基础上语料库的特征更加注重对词语长短、语句长短、词语使用频率、语法结构等进行整理统计分析,并在通过统计和检索来对文本作者本身的个人特征进行有效调查。从我国现阶段来看,法律语料库的分析在司法鉴定当中的使用案例很少,而口头的言语分析在其中却有着较强的实践特征。该类语料库能为司法鉴定提供真实可靠的有效信息。

4.4 法庭审判

由于法庭审判本身涉及的案件较多,因此其应用范围也更加广阔。在不同案件类型的语料库中,民事案件、刑事案件等各有不同点,前者侧重于对离婚财产纠纷等的语料库搜集,后者更加侧重于对走私、毒品、洗钱等的语料库进行搜集,并应用于实际的法庭审判中,根据不同案件的事实分析和心理分析,对犯罪嫌疑人的思想、身份群体、社交关系等进行有效调查。庭审语料库的使用对陪审团和案件记录有着重要的影响作用。

5 结语

综上所述,在法律语言学下的汉语语料库的构建应用前景较好,其应用范围较广,根据现阶段发展状况和对未来的趋势所见来看,汉语语料库的发展方向将会向更加多元化的方向发展。在时代的不断进步和发展过程中,信息科技不断突破原有的发展水平,顺势而衍生出的还有多语种语料库、网络语料库和其他的信息处理语料库等,这些使用的技术也更加先进,对于法律语言学的研究提供客观辩证发展的应用帮助。

猜你喜欢
建库语料语言学
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
“数字温县”建设项目通过验收
高校图书馆回溯建库探微
基于语料调查的“连……都(也)……”出现的语义背景分析
认知语言学与对外汉语教学
中文期刊回溯建库的实践与思考——以贵州省图书馆为例
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
基于数据字典的空间数据库通用建库技术