人工翻译、机器翻译与译后编辑的对比实证分析
——以汉语介词结构翻译为例

2021-10-20 08:40威,明
关键词:例句介词译文

张 威,明 昊

(东北大学 外国语学院,辽宁 沈阳110819)

一、引言

在全球化与信息化背景下,语言服务行业快速发展。翻译需求的增长和对时效性的要求,提高了对翻译速度的要求。2016年11月,谷歌推出了神经机器翻译系统,使机器翻译的质量再次提升,但为了保证译文的流畅和准确,仍需人工介入。介入的主要表现为译后编辑(machine translation post-editing)。BS ISO将译后编辑定义为“检查和修正机器翻译的输出”(edit and correct machine translation output)[1]。

译后编辑实证研究自2000年以来呈上升趋势。关于译后编辑过程及产品评估的实证研究表明,相对于人工翻译,译后编辑在不同程度上提升了翻译速度和质量。但这些研究多使用整篇翻译材料进行测试,对于特定语法项目、差错更正环节的译后编辑,以及译后编辑受机器翻译译文的影响仍缺乏研究。鉴于此,本研究尝试从翻译速度、译文可接受度、译文与机器翻译译文相似度三个方面对人工翻译和译后编辑进行对比研究,并对机器翻译介词结构的错误进行分析,旨在回答以下问题:在进行介词结构翻译的差错更正时,人工翻译与译后编辑的翻译速度有何差异?人工翻译与差错更正后的译后编辑的译文可接受度有何差异?与人工翻译相比,译后编辑与机器翻译译文的相似度如何,受到机器翻译译文的何种影响?机器翻译在翻译介词结构部分时会发生哪些典型错误?

近年来,已有不少关于译后编辑的实证研究。Garcia发现,在进行英汉双向翻译时,相对于人工翻译,译后编辑的速度提升不明显,但可接受度更高[2]。Arenas发现,相对于未提供机器翻译译文时(人工翻译),提供机器翻译译文(译后编辑)提高了翻译的速度和质量[3]。Plitt和Masselot的实证研究结果表明,译后编辑提高了所有参与者的翻译速度,平均产出提高74%,任务时间缩短43%[4]。王湘玲和王婷婷的实证研究结果表明,译后编辑能显著缩短任务完成时间,能提高翻译速度及翻译质量[5]。陆强等研究表明,事前培训和译员本身经验对译后编辑速度有较大影响,译后编辑并不一定都能提高效率[6]。蒋跃等使用向量距离评估方法对比了人工译本与在线机译译本被动句翻译特征的相似度,结果表明人工译本和在线译本差异较大,人工译本之间差异较小,在线机器翻译的质量与人工翻译尚有差距[7]。

综上,现有研究已在译后编辑的翻译速度与译文质量方面有所涉及,取得了一定成果,但对介词结构等英汉语言系统中差别较大的语法现象的研究未得到足够重视,文本相似度、情感分析等手段未得到充分利用。在借鉴前人研究的基础上,本文尝试对比人工翻译和译后编辑在进行介词差错更正时的翻译速度、译文质量及与机器翻译译文的相似度,归纳机器翻译在进行介词结构翻译时的典型错误。

二、研究设计

(一)受试

本研究的受试对象分别是40名翻译硕士研究生及111名英语专业高年级本科生。翻译硕士随机分为两组,进行人工翻译和译后编辑。本科生为译文可接受度调查的受试者。研究剔除了用时过少(完成问卷时间在10%分位及以下,即用时在343.40秒及以下)及部分信息缺失的问卷,最终纳入数据分析的为40名英语翻译硕士研究生的译文及96名英语专业本科生的问卷结果。

(二)实验材料

本实验的语料原文来自文学文本The Lord of the Rings第一部,例句中涉及“over”“by”“with”等介词结构,同时排除了句子过长、理解过多依赖句段外语境的句子,选句最长包含41个单词,最短包含10个单词。机器翻译译文来自谷歌在线翻译。问卷设计使用了人工翻译和译后编辑得到的40份译文和谷歌翻译的译文,剔除了20组译文中5组普遍良好或较差的译文。问卷包含15组量表,每组量表包含同一原文的2段人工翻译译文、2段译后编辑译文和1段谷歌翻译译文。译文顺序随机,每个译文可被赋予1~5分,一组量表内每种分值只能给出一次。例如,给第3组中的a译文打5分后,将无法给其他4段译文打出5分。

三、研究发现与讨论

(一)人工翻译和译后编辑用时对比

机器翻译的优势之一在于翻译速度快,但是目前涉及某种特定语法结构的翻译结果尚存在缺陷,这时就需要译后编辑的介入,以保证译文准确、流畅。因此,有必要考察针对误译的译后编辑在用时方面与人工翻译是否存在差异。翻译用时以分钟为单位,译后编辑较人工翻译用时平均长3.1分钟。

对两组数据进行单样本K-S检验和方差齐性检验,结果见表1,两组数据均呈正态分布且方差齐。

表1 翻译用时单样本Kolmogorov-Smirnov检验

对数据进行独立样本T检验后发现,不同组间独立样本T检验统计量t=-0.41,P值为0.684>0.01,因而研究认为,人工翻译和译后编辑两种翻译方式在用时方面不存在显著差异,结果见表2。

表2 翻译用时独立样本T检验结果

表2分析表明,在机器翻译译文中包含介词相关的误译时,译后编辑与人工翻译速度相近。译者在进行差错更正时,需要找到机器翻译译文中的错误并进行更正,从翻译用时的分析结果来看,这一过程一定程度上降低了译后编辑的效率,使得人工翻译和译后编辑的速度相近。但在收集本次试验所用包含介词错误翻译的段落时,发生该种错误的比例并不大,因而在进行整篇文本的译后编辑时翻译速度应当高于人工翻译。

(二)人工翻译、译后编辑与机器翻译译文相似度分析

受语言接触规律的影响,译后编辑的译文相对于人工翻译的译文,应与机器翻译有更高的相似度。用量化的方式考察译本相似度,可以科学客观地验证这一假设,从而为译后编辑的必要性提供理论基础,并为译者在译后编辑的实践过程中应保持的审慎和科学精神的要求提供依据。使用Python语言、jieba库进行中文分词,并用gensim库计算人工翻译译文与机器翻译译文、译后编辑译文与机器翻译译文间的相似度。相似度计算中使用了TF-IDF算法。

jieba中文分词是一个被广泛使用的Python中文分词组件,支持繁体、简体中文,支持自定义词典,基于前缀词典实现高效的词图扫描。它生成句子中汉字所有可能成词情况所构成的有向无环图(DAG),采用动态规划查找最大概率路径,找出基于词频的最大切分组合。对于未登录词,采用了基于汉字成词能力的HMM模型,使用Viterbi算法[8]。Gensim框架由Ivan Menshikh所在团队开发,并于2015年作为Python第三方扩展包开源,提供了自然语言处理常用模型的API调用接口[9]。TF-IDF方法是文本相似度量的方法中最为典型的一种[10]。

在Windows系统下安装Python并配置好相应的环境变量,然后打开命令提示符,输入“pip install jieba”“pip install gensim”指令来安装jieba库和gensim库。输入指令界面如图1所示。

图1 获取ge ns im、jie ba等库

将代码中“texts=open(r'译文目录','r',encoding='UTF-8').read().split(' ')”一行的“译文目录”改为包含所要处理的译后编辑和人工翻译译文的txt文档路径,将“keyword='机器翻译译文'”一行中的“机器翻译译文”改为上述译后编辑和人工翻译译文对应的机器翻译译文,运行修改后的代码即可得到该组人工翻译、译后编辑译文与机器翻译译文的相似度。需要注意的是,人工翻译和译后编辑译文在txt文档中各段需用回车分隔,txt文档应采用UTF-8编码。

图2显示的是使用Sensim处理20组例句得出的译后编辑与机器翻译译文的相似度,以及人工翻译与机器翻译译文的相似度。相似度越接近1,说明译文与机器翻译译文越相似;越接近0,说明译文与机器翻译译文越不相似;一个段落和它本身的相似度为1。如图2所示,译后编辑译文的相似度不同程度高于人工翻译译文。译后编辑译文明显受到了机器翻译译文的影响。

图2 人工翻译与译后编辑相对于机器翻译的相似度

从人工翻译与译后编辑相似度的差值及均值都可看出,不同的例句存在差别。其中,例句4相似度差异相对较小,仅有0.012258;例句12差异相对较大,为0.163744。

例句4:

原文:She passed out of the room with a glimmer and rustle.

谷歌翻译译文:她微微一阵沙沙作响地走出了房间。

此例句体现出较大的相似度,是由于句子结构和使用词汇相对简单,是介词“with”的标准用法,因而机器翻译和人工翻译在词汇选择上未体现出明显差异,译后编辑主要是对句子中词的顺序与关系做出调整。

例句12:

原文:Haldir skillfully cast over the stream a coil of grey rope,and he caught it and bound the end about a tree near the bank.

谷歌翻译译文:哈尔迪尔熟练地将一圈灰色的绳子抛在溪流上,他抓住了绳子,将末端绑在河岸附近的一棵树上。

此段产生较大差异的原因在于名字“Haldir”的翻译和绳子抛出的终点。译后编辑在翻译姓名“Haldir”时多直接采纳了谷歌翻译的结果,而人工翻译在姓名上相对不统一。此外,谷歌翻译将“cast over the stream”错误地翻译为“抛在溪流上”,译后编辑的20份译文有13份采纳了这一翻译,6份译为“抛到河对岸”;而人工翻译的20份译文中9份译为“抛进河中”,10份译文译为“抛到河对岸”。可见,译后编辑组在这一段落上受到了谷歌翻译误译的影响。

(三)人工翻译、译后编辑与机器翻译译文可接受度分析

通过配对样本T检验,分析人工翻译、译后编辑、机器翻译这三种翻译方式的译文可接受度是否存在显著性差异,并分析机器翻译中可接受度较高的译文及人工翻译和译后编辑译文中可接受度相差较大的译文。

通过SPSS 21的描述功能生成三组数据的描述统计量,结果见表3。可以看出,人工翻译与译后编辑相比,均值和极小值接近,二者整体上得到了相近的可接受度评价,译后编辑的最低得分稍高于人工翻译;而在极大值方面,人工翻译的3.950高于译后编辑的3.595,说明人工翻译相对译后编辑在可接受度方面有更高的上限。如果极大值和极小值存在偶然性,那么均值可以说明一定程度上具有普遍性。在这组例句的可接受度调查中,人工翻译略高于译后编辑,译文可接受度整体上明显高于机器翻译译文。

表3 描述统计量表

在进行配对样本T检验前,需通过K-S检验分析三种译文可接受度是否呈正态分布。渐进显著性值分别为0.950、0.802、0.592,均大于0.05,说明三组数据均呈正态分布,可以进行配对T检验,结果见表4。

表4 配对样本T检验

根据表4,人工翻译—译后编辑间Sig.值为0.981>0.01,不存在显著差异;而人工翻译—机器翻译、译后编辑—机器翻译这两对Sig.值均为0.000<0.01,存在显著差异。

研究认为,人工翻译与译后编辑的译文可接受度相近,而人工翻译、译后编辑这两种翻译方式的译文可接受度均与机器翻译的译文存在显著差异。结合译文可接受度的均值,人工翻译、译后编辑这两种翻译方式的译文可接受度明显高于机器翻译。当机器翻译译文存在介词翻译错误时,译后编辑有效地更正了机器翻译错误,达到了和人工翻译相近的可接受度水平。

表5为15组编入问卷的例句的可接受度平均得分。其中,人工翻译相对于译后编辑表现较好的为例句3,译后编辑相对于人工翻译表现较好的为例句5,差值分别为1.37和-0.84。例句12的译后编辑与人工翻译可接受度差别最小,仅为0.08。下面将对这些例句进行分析。

表5 译本可接受度得分数值表

例句3:

原文:This quest may be attempted by the weak with as much hope as the strong.

谷歌翻译译文:弱者可能会尝试与强者一样多的希望。

该例句的机器翻译译文质量不高,未能给译后编辑组提供适当帮助,反而影响了输出译文的质量。其原因是句中连续涉及了两个介词:“by”“with”,而连续使用介词的句子是机器翻译容易出错的地方,原因可归结为机器的语义识别,尤其是复杂结构的语义识别还不够精准。

例句5:

原文:I do not doubt that news of the discomfiture of the Riders has already reached him,and he will be filled with wrath.

谷歌翻译译文:我毫不怀疑骑手们陷入混乱的消息已经传到他身上,他将充满愤怒。

该例句机器翻译错误发生在将“he will be filled with wrath”译为“他将充满愤怒”,这不符合汉语习惯,但容易调整。机器翻译译文中前半句翻译相对准确,为译后编辑组提供了一些帮助,使得译后编辑译文可接受度明显高于人工翻译。

例句12:

原文:A red light was on their tired and anxious faces;behind them the night was like a black wall.

谷歌翻译译文:他们疲倦而焦虑的脸上红灯亮着;在他们后面的夜晚就像一堵黑墙。

这一例句难度不高,机器翻译译文中的错误容易识别,人工翻译时也并不困难,因而译后编辑和人工翻译表现相近。

(四)谷歌机器翻译在进行介词相关翻译时的错误分析

下文对谷歌在线翻译的译文进行分析,归纳谷歌机器翻译在进行介词相关翻译时发生的错误,以期对机器翻译和译后编辑的研究、发展有所帮助。

在20个例句中,较为典型的错误有:主语混乱;介词短语结构识别不准确,翻译不当;介词含义选择不当;不符合汉语表达习惯。

1.主语混乱:多发生在介词后,错误为将介词后的成分误译为主语,在进行译后编辑时较易识别。

(1)原文:For awhile he sat with unseeingeyes.

谷歌翻译译文:有一段时间他看不见的眼睛坐着。

主语本应为“he”,“with unseeing eyes”表示状态,这里错误地将“unseeing eyes”判定为主语,使得译文搭配混乱(eye+sat),不能构成理解。

(2)原文:and ascarf was swathed round his neck and over his chin tokeep out the fog.

谷歌翻译译文:一条围巾围在脖子上,下巴遮住了雾。

错误地将“his chin”判定为主语,抵挡雾气的应是“scarf”,这里误译为“下巴遮住了雾”。前文提及的机器翻译不能精准识别语义结构在这里再一次得到证明,机器把句子前半部分介词“over”的宾语“his chin”辨别成了“keep out the fog”的主语。

2.介词短语结构识别不准确,翻译不当:主要是将有固定含义的介词短语分开翻译,导致误译。

原文:Mr.Bilbo is free with his money,and there seems no lack of it.

谷歌翻译译文:比尔博先生的钱是自由的,似乎不乏钱。

“be free with his money”应译为“出手阔绰”,这里翻译成了“钱是自由的”应该是没有准确识别出“be free with”这一介词短语。

3.介词含义选择不当:主要是将介词简单翻译为空间上的方位(上、下),不符合语境。

原文:It has great virtues,but over such a wound as this its healing powers may be small.

谷歌翻译译文:它有很多优点,但是在这样的伤口上,它的治愈能力可能很小。

句中的“over”表示作用的对象,应译为“对于”,这里译为方位“在……上”,搭配混乱,干扰读者的理解。

4.不符合汉语表达习惯:主要是按词词对应的方式翻译,不符合汉语的表达习惯,进行译后编辑时可使用成语或常用的词语替代。

(1)原文:he will be filled with wrath.

谷歌翻译译文:他将充满愤怒。

直接将“filled with”译为“充满”,将“wrath”译为愤怒,直接把介词短语的基本意思译出,没有考虑汉语的表达习惯和文本的语体特点,显得非常生硬,译后编辑时可替换为“大发雷霆”“愤怒不已”等。

(2)原文:one by the name of Baggins……

谷歌翻译译文:一个以巴金斯的名字命名的人……

直接将“by the name of”译为“以……的名字命名”,不符合汉语习惯,译后编辑时改为“叫作……的人”,更为自然、贴切。

四、结论与启示

本研究以40名MTI学生及111名英语专业高年级本科生为被试,从翻译速度、译文质量、译文与机器翻译译文相似度三个角度,比较英译汉机器翻译介词误译的译后编辑译文和人工翻译译文,分析时有如下发现。

1.在进行介词误译更正时,译后编辑与人工翻译速度相近。现有研究多采用整篇文本进行人工翻译和译后编辑速度的测试,得到的结论也不尽相同。本文的结果表明,在所有句子都需要进行修改时译后编辑与人工翻译的速度相近,因而在进行译后编辑效率研究时,应当限定使用文本的篇幅、类型,并对译后编辑的不同环节分别进行测试。

2.在译文质量上,译后编辑译文的得分相对集中,中位数与人工翻译相近,最大值低于人工翻译,而人工翻译和机器翻译译文质量都明显优于机器翻译。译后编辑整体上有效地对机器翻译译文进行了修正,并保持了与人工翻译相近的速度。通过对个别人工翻译、译后编辑可接受度接近或相差较大的段落进行分析,结果发现:在原文较为简单且机器翻译错误容易识别的情况下,人工翻译与译后编辑译文质量接近;在原文有一定难度且机器翻译译文质量不高的情况下,人工翻译译文质量高于译后编辑;在机器翻译译文错误容易识别且整体质量较高时,译后编辑译文质量高于人工翻译。

3.与人工翻译相比,译后编辑译文与机器翻译译文的相似度更高。所选例句难度普遍不高,词汇相对简单时,人工翻译与译后编辑的相似度接近;译后编辑在翻译名字、地名等需要音译的词汇时,相对统一,在这种情况下人工翻译的相似度会低于译后编辑。

4.机器翻译在翻译含有介词部分时的主要错误包括主语混乱、介词短语翻译不当、介词含义选择不当和不符合汉语表达习惯。主语混乱的句子常将原文中介词后的成分当作主语,较易识别;介词短语翻译不当主要是将有固定含义的介词短语拆开翻译,应结合语境进行调整;介词含义选择不当主要是将介词简单地译为上、下等空间位置,应结合上下文进行调整;不符合汉语表达习惯主要是逐词翻译导致译文生硬,可替换为成语或更自然的短语。

随着机器翻译译文质量的提升,译后编辑翻译速度将进一步提升。未来可在本研究设计基础上,使用击键记录以更好地分析译后编辑在不同情况下的翻译速度和质量,亦可尝试使用不同的相似度计算方法,计算人工翻译译文、译后编辑译文、机器翻译译文和由职业译员翻译的译文之间的相似度,从而更加深入地研究译后编辑的翻译速度与质量、译后编辑和机器翻译的译者风格。译后编辑正逐渐成为翻译行业的主流翻译模式之一,因而翻译教学在传统教学内容基础上也应增加译后编辑的相关培训。

猜你喜欢
例句介词译文
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
介词和介词短语
介词不能这样用
弟子规
弟子规
好词好句
好词好句
好词好句
好词好句
译文