基于汉英平行语料库对汉语词汇的英译研究
——以汉语常用动词“发展”为例

2010-09-11 09:54刘克强沈映梅
红河学院学报 2010年3期
关键词:汉英语料平行

刘克强,沈映梅

(红河学院外语学院,云南蒙自661100)

基于汉英平行语料库对汉语词汇的英译研究
——以汉语常用动词“发展”为例

刘克强,沈映梅

(红河学院外语学院,云南蒙自661100)

语料库语言学与语言学习的结合已有时日,但如何使用平行语料库进行翻译的研究才刚刚开始。对于汉英翻译来说,汉英平行语料库对汉英词汇对等系统的建立能够提供很大的帮助。在自建汉英平行语料库的基础上,本文通过提取汉语的高频动词“发展”,从而发现和总结其在不同文本中的英语翻译规律。旨在为今后翻译与之相关的句子时提供真实、可靠的译例,同时也表明平行语料库在翻译当中有广阔的使用前景和潜在的开发价值。

发展;平行语料库;翻译

引言

目前,国际上建立了为数不少的平行语料库,加拿大是最早建立的国家之一,研究者收集加拿大议会辩论的英法双语建立了Hansard平行语料库[3],以研究英法双语词汇和句型翻译。但一般认为,Mona Baker[2]发表的论文是推动语料库翻译研究发表的开山之篇,此后一批学者利用语料库探讨翻译方面的诸多问题。在国内,北京外国语大学建成了规模约2,000万字词的大型句对齐英汉平行语料库[7],基于此语料库,该校研究人员已展开了翻译领域的相关研究,不过大众能接触到的很少,且他们研究的大多是翻译的普遍性问题,对于词汇、句子层次的研究相对比较少。然而,词汇的翻译在翻译具体实践中往往起着很大的作用,因此研究词汇,尤其是常用词汇的对应翻译显得尤为重要。

《现代汉语常用词表(草案)》[5]将“发展”这个词排在其词表的第一百七十一位,Xiao[4]著的《汉语词频词典》中,基于汉语语料库,按照词频编排了汉语常用的五千词,“发展”作为动词位于第一百零九位,而在所有的动词中居第二十二位。这本词典是基于七千三百万汉字约合五千万词的汉语语料统计分析出来的,而且这些语料包括四大语域:口语,新闻,小说,非小说。因此我们可以断定,“发展”这个动词确确实实为汉语常用动词。作为汉语常用动词,在汉语中出现如此频繁,在翻译过程当中如何根据上下文情况翻译“发展”呢?是不是一碰见“发展”就翻译成“develop”,“development”呢?下面我们通过自建的汉英平行语料库来展示如何分析“发展”的翻译情况。

一汉英平行语料库的构成

要利用汉英平行语料库来进行翻译研究,就必须建立相应的汉英平行语料库,在选择汉语译文时,根据朴松林、王克非[7]的经验,首先必须注意翻译质量问题,其次是选择语料的问题和取样问题。为了保证翻译质量,本研究选择的汉语译文都是在国内外权威出版社出版,有很高质量的译文;在语料的选择方面,尽量多地选择各种体裁的语料。着眼于实际研究的需要,所有语料都是全文收录。此语料库分为三部分:小说部分,非小说部分,科学技术部分。

其中小说部分包括:《鲁迅小说集》、《子夜》、《围城》、《春蚕》、《骆驼祥子》、《青春之歌》、《暴风骤雨》、《芙蓉镇》等小说及其英语译文,其中汉语以字计算,英语以词计算,共计约250万字词。

非小说部分包括:《毛泽东选集》、《邓小平文选》、政府白皮书、政府工作报告及一些法律文件及其英语译文等。计算方法同上,共计约包含300万字词。

科技部分大多是电脑、工程方面的资料及其英语译文,计算方法同上,共计约有50万字词。

二语料的对齐

如前所述,本研究的目的是为了找出“发展”对应的翻译,即提取语言间对译转换的信息。因此,我们首先需要确立每对词汇翻译在各自语言的相应语境,如段落、句子,为实现这个目标,必须借助于软件帮助对齐局部单位,根据研究需要,本文使用Trados的WinAlign。下面以2009温家宝总理所做的政府工作报告的汉语版本及其英译版本的部分段落为例来说明如何进行句子层次的对齐。限于篇幅,表1是政府工作报告的一小部分。实际操作时,应当将报告的汉、英全文进行对齐。

表12009 政府工作报告部分汉语及其英语翻译

这里使用的是TRADOS 7.0,在安装此软件后,点击TRADOS 7.0,在其下菜单中选择“WinAlign”,双击“WinAlign”,进入对齐工作界面,在文件菜单下选择“new project”后,再依次选择待对齐语料的语言,选择的source language为汉语,target language为英语。在进行相关切分的标点设置后,载入待对齐的汉、英语料,就可以进行对齐了,运行后的界面如图1所示:

图1 TRADOS WinAlign将语料对齐后的界面

由于是软件辅助对齐语料,不可能做到百分之百正确,好在此软件提供了人工干预的很多命令,点击认为对齐不尽如意的地方,可以进行合并、切分等等,限于篇幅,此处不再深入。最后将满意的对齐语料保存并导出,然后整理该文件,就生成汉、英平行语料库了。

三语料的标注

为了实现对动词“发展”的提取,从而发现对应的翻译,必须给汉语语料添加某种符号,以便软件识别和提取,利用中科院开发的ICTCLAS 1.0(汉语词法分析系统1.0版)[8]可以给汉语语料的每个词加上对应的词性符号,为了便于分析,从该报告中选择下面一句:“按照出手要快、出拳要重、措施要准、工作要实的要求,迅速推出进一步扩大内需、促进经济增长的十项措施,争分夺秒地加以落实;接连出台金融支持经济发展、促进轻纺工业健康发展、促进房地产市场健康发展、搞活流通扩大消费和保持对外贸易稳定增长、稳定就业等政策措施,加快制定重点产业调整振兴规划。”利用ICTCLAS标注后,本句话就变成:

按照/p出手/v要/v快/a、/w出/v拳/n要/v重/a、/w措施/n要/v准/a、/w工作/vn要/v实/a的/u要求/n,/w迅速/ad推出/v进一步/d扩大/v内需/n、/w促进/v经济/n增长/vn的/u十/m项/q措施/n,/w争分夺秒/i地/u加以/v落实/v;/w接连/d出台/v金融/n支持/vn经济/n发展/vn、/w促进/v轻纺/j工业/n健康/ad发展/v、/w促进/v房地产/j市场/n健康/ad发展/v、/w搞活/v流通/vn扩大/v消费/vn和/c保持/v对外贸易/l稳定/a增长/vn、/w稳定/ad就业/v等/u政策/n措施/n,/w加快/vd制定/v重点/n产业/n调整/vn振兴/vn规划/n。

四动词“发展”及其翻译的提取

观察经过标注后的语料,可以发现原来的汉语语料进行了词切分,并且对切分后的词附上词性码,如“发展”一词,就被标上“/v”和“/vn”两种词性,前者表示动词,也就是我们所要分析的;后者相当于动名词。这样我们将对齐并标注的语料载入ParaConc软件(Barlow,2003),检索“发展/v”就可以将所有的动词“发展”所在的句子提取出来,而这些句子所对应的英语翻译也相应的显示出来。图2就是载入语料后,在该软件的search框中输入“发展/v”,得到的结果。

在图2中点击上框中每一句汉语,下框就有是它对应的译文,这样就可以进行“发展”的翻译分析。为了方便阅读汉语句子,在下面的例子当中,须将进行标注的汉语句子进行整理,去掉词的词性标注。

五动词“发展”在不同文体中的翻译情况

(一)在小说文体中的典型翻译

1.现在订了婚,彼此间还留着情感发展的余地,这是桩好事。

In the case of their engagement now,there was still room left between them for their feelings to develop,and that was a very good thing.

2.他们发展企业的一场大梦!现在快到梦醒了罢?

They had dreamed of giving industry a new lease of life,but now-now it looked as if they would soon be brought back to earth with a jolt!

3.外围组织也几乎都被破坏;剩下的,情绪不安,也很难发展。

Most of the organizations close to the Party have broken up,the rest are so disorganized that it is equally hard for them to expand.

4.他不断化装,不断地变化着职业,因此,他来到定县虽然半年多了,可是敌人并没有发觉他,而定县农村中的革命组织却一天天地恢复并发展了。

He changed his disguise and occupation so often that he was able to work in Tinghsien for more than half a year without being discovered.The revolutionary bodies in that area gained strength with every passing day.

5.有志之士被压迫得慢慢像西洋大都市的交通路线,向地下发展,地底下原有的那些阴毒暧昧的人形爬虫,攀附了他们自增声价。

Men of good will were so depressed that,like the transportation lines in major Western cities,they slowly began to go underground,while the dark,insidious reptiles in human form,which had been underground all along,boosted their prestige by latching on to them.

(二)在非小说文体中的典型翻译

1.进一步发展高中阶段教育、高等教育和各类职业教育。

Efforts should be made to further develop senior secondary school education,higher education and all types of vocational education.

2.重点培育和发展要素市场,尤其是资本市场。

We need to focus our efforts on the development of markets for production factors,especially capital.

3.积极发展多种形式的产学研结合。

Efforts should be made to promote the integration of production,teaching and research in a variety of ways.

4.继续发展对外承包工程和劳务合作。

Overseas contracted projects and labor services should be further expanded.

5.大力发展经济适用住房,建立廉租房供应保障体系。

We need to build more affordable and functional housing and establish a system to ensure an adequate supply of low rent housing.

(三)在科技文体中的典型翻译

1.发展高强度扭杆,大幅度提高车辆的悬挂性能

To Develop the High Strength Torsion-ber for Highly Improving the Performances of the Vehicle Suspension

2.一项当前的应用--通过个人通信器查民航机票价的能力--将继续扩大和发展,最终把个人通信器转化成综合的公务出差的计划工具。

One current application,the ability to check airline fares via personal communicator--will continue to expand and develop,eventually transforming the personal communicator into a comprehensive business tripplanning tool.

3.在1995年间,语音识别和输入及管理声音和数据的功能也取得了大的发展。

Speech recognition and the capability to input and manipulate voice and data also have been big advancements during 1995.

4.短短的几年中,Internet以指数的速度发展着,从科学与学术界用的网络成长为一种通用的系统,给数百万计的人员和单位提供简单但有效的通信服务和信息访问。

In a few years,the Internet has grown exponentially from a network for the scientific and academic community into a universal system providing millions of people and organizations with simple but effective communications services and information access.

5.由于全双工和干线方案可用于将以太网带宽推向更高,以太网的发展将会继续下去。

But the story doesn't stop there,since full-duplex and trunking schemes can be used to push Ethernet bandwidth even higher.

总结

通过建设平行语料库的方法,可以发现“发展”在不同的文体中有很多种对应的翻译,它们既有相同的,也就是三种文体共享的翻译方法,更加重要的是,还有大量的根据上下文的理解和文体的不同翻译成其他的形式。这样为研究提供了真实、可靠的示例,对外语教育工作者的教学和科研都有十分重要的意义,同时也表明了双语平行语料库在翻译教学和科研上有着广阔的使用前景。

[1]Barlow M.ParaConc:A Concordancer for Parallel Texts.Paraconc Help,2003.

[2]Baker,Mona.Corpus Linguistics and Translation Studies: Implications and Applications[A].In Mona Baker,Gill Francis,and Elena Tognini-Bonelli(eds)Text and Technology:In Honor of John Sinclair.Amsterdam-Philadephia: John Benjamins,1993.

[3]Brown P,et al.Aligning Sentences in Parallel Corpora[A].In Proceedings of the 29th Annual Meetings of the Association for Computational Linguistics[C].Berklery,Ca,1991.

[4]Xiao,Richard,Paul Rayson,Tony McEnery.A Frequency Dictionary of Mandarin Chinese:Core Vocabulary for Learners.[M].London:Routledge,2009.

[5]《现代汉语常用词表》课题组.现代汉语常用词表(草案)[M].北京:商务印书馆,2008.

[6]朴松林,王克非.国内外双语对应语料库研制现状[A].王克非等著.双语对应语料库研制与应用[C].北京:外语教学与研究出版社,2004.

[7]王克非.英汉/汉英语句对应的语料库考察[J].外语教学与研究,2003(6).

[8]张华平.ICTCLAS 1.0,2002.

[责任编辑张灿邦]

On the Translations of Chinese Words Based on a Parallel Corpus——take"Fazhan"as an Example

LIU Ke-qiang,SHEN Ying-mei
(School of Foreign Languages,Honghe University,Mengzi 661100,China)

Corpus has been acclaimed recently as a new resource for language teaching.But the use of parallel corpus in translation has barely started,especially for Chinese-English translation;parallel corpus can facilitate the extraction of equivalent lexical system between Chinese and English.Based on the self-built Chinese-English parallel corpora(about 6 million characters/words in size),this paper probes into the application of parallel corpora to translation equivalent extraction with the frequent Chinese verb"Fazhan"as an example.It shows that a parallel corpus can provide rich parallel samples for the verb in different texts and its use in translation awaits widening and its potentiality awaits exploiting.

fazhan;parallel corpora;translation

book=3,ebook=62

H159

A

1008-9128(2009)02-0091-04

2010-02-22

云南省教育厅科学研究基金项目:“汉语常用动词及英译的类聚研究”(07C40184)

刘克强(1971-),男,陕西西安人,讲师,在读博士生。研究方向:应用语言学、语料库语言学。

猜你喜欢
汉英语料平行
向量的平行与垂直
平行
逃离平行世界
基于语料调查的“连……都(也)……”出现的语义背景分析
汉英倍数表达形式比较及其类型学考察
话题链在汉英篇章翻译中的统摄作用
再顶平行进口
华语电影作为真实语料在翻译教学中的应用
《苗防备览》中的湘西语料
汉英文字的幽默修辞功能浅探