韩礼德谈机器翻译

2023-04-01 11:50胡壮麟
天津外国语大学学报 2023年1期
关键词:韩礼德语言学语法

胡壮麟

(北京大学 外国语学院)

1 引言

系统功能语言学的创始人韩礼德1955 年在剑桥大学获得博士学位后曾在剑桥语言研究中心工作,任剑桥大学助理讲师,从事有关机器翻译的研究。随着计算语言学的发展,20 世纪60 年代他先在美国伯克利大学,后在耶鲁大学与Sydney Lamb合作研究。80 年代在南加州大学信息科学院与Willian Mann 及其团队合作,从事计算语言学与机器翻译结合的研究。到20 世纪末,他开始关注智能机器翻译。本文主要介绍韩礼德在上述不同时期对机器翻译所持的一些观点①。

2 机械翻译(1956)

韩礼德最早接触的是机械翻译(mechanical translation)。1956 年10 月他参加美国麻省理工学院召开的“国际机械翻译大会”,并宣读了论文《机械翻译的语言学基础》②。会议的中心议题为机械翻译,涉及三个过程:(1)翻译对等;(2)决定性特征的对等;(3)某一决定性特征在目标语中的操作(Halliday,1957)。

20 世纪50 年代的翻译对等着眼语法和词法的对比。前者在当时称为转移语法(transfer grammar),内容是对两个语言的语法进行对比,但不太成功。因为在研究中发现语法不能决定词法,研究工作还停留在对每一种语法进行描写分析,并寻找源语和译语对比的最佳点,同时词法不能依靠音系学和正字法,比较关注语言语境的研究,这包括词语搭配,一些词与另一些词同时出现,特别是在特定语境下出现,在语境中不能搭配的一些特征不应该出现在篇章中。

相较于语法,从词法进行翻译研究有两个优势:(1)词汇能更直接反映语言语境;(2)即使没有对等词,至少有相同的系统或排列。这是翻译对等研究的第一步。每个系统有若干关键词,一对一的翻译对等有高度可能性,特别是科学词汇。所谓同义词典(thesaurus)便是根据语言语境编出来的。例如,英语的railway station 在汉语中可根据不同的语境翻译成“火车站”“车站”或“站”。汉语中的“火车站”可翻译成英语的railway station 或station。尽管如此,同义词典所收词语以实义词或中性词为主,没有数和语法的区别,因为英语和汉语的动词是不对等的。因此,所有机械翻译都应考虑包括一些非词语的范畴,如词的曲折变化。

对上述情况韩礼德曾作过如下总结,始于1950 年的机器翻译,即机械翻译,是采用数学的方法,用计算机将一种语言翻译成另一种语言,从一系列的形式对等物寻找可能的对等形式,是一个工程项目(Halliday,1995)。

3 逻辑学引导的机器翻译(1960-1970 年代)

1960 年之后,学术界更多地使用“机器翻译”(machine translation)这一术语,从普通语言学的视角描述不同语言的对比和翻译。对于各种语言范畴的具体要求是能为机器所识别(Delawanay,1960)。韩礼德(Halliday,1960)则从逻辑学的视角提出以下三个阶段:(1)语言X 内每一个单位项目(语素、词等)在语言Y 中都有一个最接近的对等词,在一定条件下其他对等词也有可能出现,因此,译者在大脑中具有概率的概念,即语言Y 中哪一个词更为对等;(2)参照语言环境进行对等单位的选择;(3)应当深入考虑语言Y 内在的语法和词汇特征,如性和数的语法和谐、动词时态对等、固定的词语搭配、成语等。机器翻译是这三个阶段的最后成果,是对不同语言的共同点和不同点进行对比的结果,但它不关注不同语言的历史关系,也无需为相似点和不同点寻找理据,因此,机器翻译的对比研究不同于语言类型学。

韩礼德认为,当时的研究主要关注两种不同的依据:翻译对等与形式对比。翻译对等实际上与语法单位的范畴有关,因而我们可以将语法Y 的某个项目或单位与语法X 的项目或单位进行比较。值得注意的是,研究者对语境有进一步的认识,即语境不仅包括语言内的语境,也包括语言外的情景语境。形式对比指译者在两种语言的形式结构中进行同样操作,具有同样的形式意义和语言学意义。这就需要在单位、结构、词类和系统的语法范畴中比较。当然,两种语言的比较要以语境对等为前提,同时有效的比较也决定着对语言的描述。

两年后韩礼德(Halliday,1962)对机器翻译有了进一步的认识。第一个观点为语言学是语言的科学,不同于哲学、逻辑学、心理学、人类学、数学或交际理论。这就是说语言学家的视角应当是通过科学研究了解语言的本质和特征,而不是通过语言研究解决其他学科的问题。例如,心理学和哲学领域对意义的研究只是把语言视为代码。这无助于机器翻译研究,因为这种看法误解了语言的功能、内在关系以及与非语言的外部关系。而信息和编码之间的关系是两种不同的实体,信息独立存在于代码之外,不能决定代码的类型。可见,语言不存在这种二分法,不存在两个实体之间的关系。他认为这只能强行称之为类比(analogy)。韩礼德认为,其他学科的理论观点只是研究代码和信息的范畴,而语言学研究的是内容或概念的范畴。概念不是独立于物质之外的,它需要通过语言形式才能具象化,如语言学家需要处理的篇章。

韩礼德的第二个观点是语言模式是否按二分法对立运作。虽然语法系统如同所有封闭系统可规定二分操作,便于进行统计语言学和电子语言学操作,但这不是语言的一般真理。语言学系统更为复杂,要达到严格的定义和应用的要求,应当更严格地区分。二分法是逻辑学的概念,不完全适合语言学。从韩礼德下面所举实例不难看出未标记的汉语“学生”在实际应用时既可以是单数,也可以是复数,并不是所有系统都具有标记性。

韩礼德赞同描写一种语言不可能没有理论,但有的描写方法难以适用于计算机。就语言学而言,翻译涉及多个方面。例如,语言范畴的概念通常涉及层次(level)、单位(unit)、形式(form)、级别(rank)。情况的复杂性在于我们需要同时解决一些问题,如两个层次的形式:语法和词法,一些词与另一些词同时出现;两个层次的物质:语音的和书面的;两个层次将物质以形式体现的模式:语音学和字音学,这两者可以用二分法处理。

计算科学和语言学对机器翻译的问题都有各自的看法。机器翻译工作者否定语言的统计理论,认为除非基于合理的、科学的理论,从定性描写到定量描写便毫无意义。语言学者认为机器翻译没有理论意义而加以拒绝。有些机器翻译并非“要么全部,要么一无所有”的活动。因此,韩礼德建议可以把语音学和字音学暂时搁置一边,因为它们仅仅涉及语言的口语和文字的形式。翻译主要关注语法、词汇与语境。

韩礼德还认为,统计描写有助于推动语言理论和方法的研究,也有助于应用,如语言教学中常见的短语动词。翻译毕竟是更像/不太像的关系。计算机不能完全靠非此即彼的操作。两个语言之间的语法对等能更好地显示语义。翻译与级别有关,词不仅仅是具体的词,而且是抽象的语法范畴,如词类与结构和范畴的关系。词项是对这些范畴的说明。总的来说,为了对比,我们首先要弄清两种语言的单位在翻译对等上的概率。

由于上述不同认识,至20 世纪60 年代中期,学术界普遍认为语言翻译是自成一格的特殊转换,以语言学理论代替逻辑学。这导致在北美和欧洲产生一场灾难,那就是美国空军宣布不再为机器翻译提供经费。美国研究者随之改用“人工智能”的名称,如配对、提要、问答、专家系统等(Winograd,1972)。

系统功能语言学者Alick Henrici 在伦敦大学学院完成他的系统研究,采用形成范例(forming paradigms)、充实的体现(implementing realizations)等手段(Halliday& Martin,1981)。

4 计算机与机器翻译(1980-1995)

韩礼德所说的机器翻译的第三次转折始于1980 年。由于新一代计算机的出现,其系统能处理复杂的自然语言。计算语言学家能处理更为现实的目标。计算不仅是语言学研究的工具,也是发现有关语言特征的新方法,一方面测定语法描写,另一方面建立大型语料库(Halliday,1995)。

在此期间系统功能语言学家提出了两个阐述英语语篇生成的系统语法:一个是澳大利亚悉尼大学信息科学研究所William Manner 指导Christian Mathiessen 以日语和英语为语料所进行的语篇生成研究(Matthiessen & Bateman,1992),另一个是英国威尔斯大学的Robin Fawcett 所研究的社团语法(Communal Grammar)(Fawcet,Tucker & Lin,1993)。

在1980-1995 年这段时间中是否有过转折?韩礼德说有。最初学术界把语言看作信息交换,因而关注货物和服务的本质。此后,才深入认识到语言才是计算研究的中心对象,计算语言学应当计算意义。

总的来说,计算语言学采用描写的方式。研究者试图发展整体的形式,指出对计算的需要。这就需要发展既有细节又复杂的语法。措辞的价值首次称为系源关系(agnation),它的轨迹存在于语言的整个意义潜势中。计算语言学的操作应当是对意义的操作。这在学术界已被认为是正确的观点。

5 智能计算与机器翻译(1995-)

进入新世纪前夕,学术界普遍认为可通过智能计算(intelligent computing)来解决机器翻译的矛盾,使计算成为计算意义的同义词。韩礼德(Halliday,1995)认为,对此要分两步重新表述:一是对词语的表述需要结合措辞和语法结构,即任何范围的词汇语法背景;二是对措辞的表述,即任何范围的语义序列。这说明计算操作要进行语义操作,但进入智能计算要解决两个脱节之处:(1)知识基础重新概念化为意义基础,应该将两个系统合二为一;(2)实例及其系统。自然语言的语法被认为是一系列的结构,或按照系统功能语法,选择网络或符号潜势,即任何有意义的实例都存在于系统潜势之中,但在计算推理过程中实例不一定与整个语言系统挂钩,而是属于话语(discourse),意味着它是过程,还不是系统。但如果把话语看作篇章,对任何底层系统的一个实例进行推理就较为容易了。

韩礼德指出,上面提到的两个脱节反映了西方思维中的二元化:(1)语言和思维的二分,如当代语言学和认知科学;(2)语言(langue)和言语(parole)的二分,如语言学和语用学(Ellis,1993;Matthiesssen,1993,1998)。上述成果供计算语言学参考时可考虑如下策略:(1)语言内(语法)和语言外(概念的、认知的)可作为一个系统的两个层次:(词汇)语法学和语义学;(2)除语言和话语两种现象外,语言和言语二者中可以只考虑语言这一个现象。实例化(instantiation)可以有两个度:系统和语篇。从知识基础(knowledge base)演变的意义基础(meaning base)便可以采用语法描写。反之,每一个措辞和意义的实例都可以用整个系统描写。可见,语言和认知之间的边界成为语法和语义学、措辞和意义之间的界限。语言和言语的界限是系统(语法或语义学)和实例(措辞或意义)之间的界限(Halliday,1995)。

韩礼德还指出,智能计算对自然语言复杂性的所有方面提出严格的要求。它要求语法学把语法作为底层语言的逻辑,而不仅仅是Zadek(1995)曾经批评的数字计算。人类文明正在从硬计算(hard computing)进入软计算(soft computing)时代。新时代中人类思维被视为“一组具有模糊界限的颗粒”。换言之,智能计算是智能系统的分析和设计,像人类那样大致推理。在信息革命时期,机器智能进一步扩展,改变了人的大脑力量。Terano(1995)也观察到同样语境下微小的信息处理不再是数学模式。韩礼德指出应该换之以语法。语言不仅仅是计算的对象,也是计算的工具。智能的基础从数学逻辑改变为语法逻辑。数学和语法都是符号系统,构建不同,但互补,数字的逻辑对比与措辞和意义的逻辑(语言学逻辑)互补(Sugeno,1993)。

韩礼德(1995)指出,语法学(grammatics)能帮我们解决语言的复杂性。过去人们只谈数学的美感,很少谈语法的美感,即对各个工作系统语言的理论化,如数据融合(data fusion)和语境模拟(contextual simulation)。我们不仅找到它们的复杂性,也能找到它们的排序和操作方法。

韩礼德同时指出,语言的复杂性常体现在以下七个方面:(1)词,能进入措辞的成分,属词法;(2)措辞,能构成语义或意义的类型;(3)意义,系统构成语境的成分;(4)特定措辞/意义实例,它们在系统中所处位置的价值(在系统网络内部的归属关系);(5)次系统(sub-system),语域的变异;(6)系统,由多个功能组成,进入语义空间时可决定语法形式和语境的关系;(7)意义,包括三个历史维度:系统的演变(phylogenesis)、个别语篇的展开(logenesis)、自儿童至成人的语言发展(ontogenesis)。

韩礼德在前六点的基础上提出语言学模块的构建,可用于智能计算。词汇语法有时简称为语法。这是抽象的符号构建,成为内容和表达之间的层次,获得给定的、构建语境的价值,是抽象的,而物质现象没有抽象界面。韩礼德还进一步解释了层次有高低之分。低层次指口语和书面语的表达与人体为界面的结合点,高层次指语义学的结合点为人类经验和人类社会活动过程。不同于简单的符号系统(具有给定的意义),一个分层次的系统(包括语法在内)具有特定的性质,能构建分层次的系统,创建意义,特别是在功能语境中创建意义。语言的功能语境分两类,相应的功能也分两类:一方面语言被看作人类的经验,其功能是构建,使我们周围的世界有序化,另一方面语言被看作具有指定人际关系的功能。不同于简单的具有给定意义的符号系统,语法的元功能是将两者合成,既写也说,既看也听。系统是从远处把语言看作语义潜势,而语篇是从近处看,是语言潜势中出现的实例,也就是说只有一个现象,不是两个。语言和言语只是不同视角的说法,但我们也可以在这个变体群中持中间立场,采用语域(register)的概念。它有助于我们处理语境变异,是相似语境的语篇类型。从系统的视角看,语域是次系统。层次是不同类的关系。语义学和语法的关系区分明确,有不同的层次。在自然语言的内容方面,每个系源有不同的领域,同样语法空间的组成不同于语义空间的组成(Martin & Matthiessen,1991)。可以将同样的概念上下扩展,称为体现,如情景语境,将语境作为符号系统。

上述观点如何和智能计算联系?这就要求将自然语言作为计算机语言,但人们有时忘记每种语言的拼写系统涉及大量有关意义的复杂问题,有些意义需要辨认或识别,如you can go 与can you go。又如,韵律和语调可表示不同的强调,这里情态(modality)计算过程很重要。因此,智能计算对自然语言复杂性的所有方面提出严格要求,要求把语法作为底层语言的逻辑。

对任何知识的知晓在于把有关知识转换成意义,因而所谓理解便是这个符号转换过程,这两者构成语篇元功能。意义的流动在于对有关成分的激活,其成品就是话语。

语言的语法系统是对矩阵中每个成分在聚合体中的选择,如肯定/否定、过去/现在/将来、叙述/命令等在聚合体中的最后体现。因此,概括地说,语法是资源。意义便是在不同矩阵中进行选择,知道越多,掌握越深入、越细致。

韩礼德认为,计算机如能像幼儿学语言那样工作才能使操作有效。到目前为止,计算机是通过各种系统的中介和根据语言派生的逻辑进行操作的,在此过程中要丢失好多信息,因此,提出语言本身将成为主要的计算资源。这能保持信息水平,也能探索自然语言的正面特征、功能的多元性、系统的转换等。韩礼德认为,这与Sugeno(1993)的研究有关,如数据的融合(将来自语言的信息与数字、符号、图像和非语言声响进行整合)。结合篇章对情景语境进行构建,即使从自然语言直接获取这些元语言观点,还要解决各种不同的体现范式。使用语言计算意味着使用意义计算,因此某些语义表达形式至关重要。

6 结语

韩礼德在有生之年除倡导系统功能语言学外,也关心与语言有关的其他学科的研究和发展,如比较语言学和翻译学。由于篇幅所限,本文重点介绍韩礼德在不同时期对机器翻译所持理论的演变过程,试图说明人类对任何事物本质的认知和探索过程是在实践中不断发现问题、解决问题的过程。即使机器翻译在本世纪已经进入智能计算的高水平时期,许多问题仍有待我们进一步发现、讨论和解决。我们要让机器翻译在构建人类语言共同体和人类命运共同体方面发挥更多的作用。

注释:

① 本文为2022 年10 月22-23 日国际韩礼德语言学研究会上的发言稿。

② 本文有关韩礼德的论著均引自J. J. Webster 编《韩礼德文集》,请参见参考文献的有关条目。

猜你喜欢
韩礼德语言学语法
跟踪导练(二)4
Book 5 Unit 1~Unit 3语法巩固练习
系统功能语言学视角下的日语听力语料库建设研究
系统功能语法在语言教学中的应用
认知语言学与对外汉语教学
从人际功能的角度来研究《伊芙琳》和《死者》
Halliday and Systemic—Functional Grammar
社会语言学名词
语料库语言学未来发展趋势
基于认知语言学的“认知修辞学”——从认知语言学与修辞学的兼容、互补看认知修辞学的可行性