徐彬、宋爽:AI 时代译后编辑的典型错误与译者培养AI 时代译后编辑的典型错误与译者培养 徐彬 宋爽 摘要:人工智能大背景下机器翻译的进步速度逐渐加快,随着MT的性能不断提高,译文质量越来越接近于人工翻译,使得译后编辑的翻译生产模式越来越可行。但是,MT也给语言服务企业、译员以及翻译人才培养等带来了挑战。本文认为,未来简略译后编辑会随着AI以及MT的进步而逐步消失,要想有效地培养能够胜任全面译后编辑工作的译员,则应该遵循“先成翻译良才,再尝试PE”的基本原则。 关键词:机器翻译;译后编辑;译者培养 译后编辑(Post-Editing, PE)是随着机器翻译(MT)的逐渐成熟而流行起来的翻译生产活动。关于译后编辑,维基百科的定义如下: 译后编辑指的是“通过少量的人工修改以对机器生成的翻译进行完善”的过程。进行译后编辑的人员被称为译后编辑员。 在国内,翻译界对译后编辑的探索始于20世纪80年代末。在MT刚刚走上“民用”阶段的时候,就有人提出了“译后编辑”的翻译模式,只不过那时候还没有出现“译后编辑”这个名词。但是实践证明,除了专门领域的受控制文本以外,对于绝大多数类型的文本,22世纪80年代末至21世纪初开放给民用的MT引擎所提供的结果,都是“改不胜改”。词汇层面乏善可陈,句子层面问题更多,使得翻译实践领域对译后编辑的探索未能推广开来。 翻译领域真正大规模的译后编辑实践的开展,始于谷歌2009年6月推出的“谷歌译者工具包“(Google Translator’s Toolkit)①,这是一款采用了全新的“智能对照界面”的基于浏览器的机辅翻译系统。除了智能对照界面、便捷的网络协同之外,这款应用最大的特点就是默认使用谷歌的机器翻译引擎对用户上传的待翻译文档进行预处理。而且,由于2009年谷歌的基于统计的机器翻译引擎,较其他MT有了大幅度的进步,一些译员经过尝试,意识到“译后编辑”至少在特定类型的文本翻译上是可行的。可以说,免费的、易用的谷歌译者工具包的推出,在很大程度上推动PE工作模式逐渐流行起来。 随着PE实践的发展,我们发现,维基百科对PE的定义已经有些不准确了。比如,定义中说“译后编辑指的是‘通过少量的人工修改以对机器生成的翻译进行完善’的过程”,这一陈述仅仅涵盖了“简略译后编辑”的内容,而未包含“完全译后编辑”等类型。 (一)简略译后编辑 简略译后编辑又称为“简便型译后编辑”或“快速型译后编辑”,是指译后编辑员被严格要求对文本进行最少干预以使终端用户理解文本大意,只需要在机器译文的基础上进行最低限度的编辑,使译文可以读懂,并且内容准确、语句通顺即可。此种译后编辑方式的目的是使客户对文本有大概的理解,并且往往是在时间十分紧张的情况下使用的。 在一些语言、任务以及特定领域已经存在高质量的机器翻译引擎的情况下,一些客户已经开始要求翻译公司或者译员直接提供简略译后编辑,而不是从头开始翻译。因为他们认为,一方面,通过简略译后编辑,可以花更低的费用获得质量差不多的翻译产品;另一方面,简略译后编辑可以大大提高译文生产效率,让客户更迅速地获取信息。 (二)完全译后编辑 完全译后编辑又称为“深度译后编辑”、“全面译后编辑”或“全面型译后编辑”,是指对机器翻译的文本进行更深入的翻译加工,以达到客户和译后编辑员事先商定好的较高的翻译质量。采用此种译后编辑方式,可以使最终文本具有很高的可读性,可以用于新闻、出版等有较高要求的领域。全面译后编辑的最高境界,是生产出与纯人工翻译(from-the-scratch translation)生产的文本具有同等质量的文本。 人们对于译后编辑这种工作模式的看法经历了三个阶段。 (1)否定阶段。在此阶段,绝大多数译员认为MT的结果“不可卒读”,错误“改不胜改”,经过评估发现译后编辑不仅无法提高效率,反而会造成更多的问题,所以拒绝使用这种工作模式。 (2)尝试、怀疑阶段。随着谷歌陆续推出多语种的统计机器翻译,并将其应用在免费的谷歌译者工具包上,越来越多的译员“被迫”尝试在新的MT引擎所产生的译文基础上进行PE。同一时期,大多数译员仍对这种模式存在怀疑。另外,在这一阶段,对译后编辑最主要的抵制来自客户。 (3)接受阶段。随着人工智能(AI)技术的发展,神经机器翻译出现,使语言服务产业的从业者和普通大众对MT有了更多、更科学的认识,他们更加认可MT的质量。这一阶段,更多的译员以及语言服务企业开始接受甚至全面采用译后编辑的生产模式。 关于PE,笔者咨询过一些翻译公司的负责人,询问他们对这种工作方式的态度。综合起来,这些翻译企业的管理者认为PE主要面临以下四个方面的问题。 (1)部分译员抵制:公司工作人员中有的不愿意采用译后编辑的工作方式。 (2)PE人才缺乏:PE人才难觅,新培养PE人才存在困难。 (3)兼职译员滥用:不少兼职译员偷偷用机器翻译,返回质量不高的译后编辑的译文,加重了译审的工作负担,最终质量也难以保证。 (4)客户反对PE:一些客户在收到译员滥用PE导致的不合格译文后,在采购翻译服务的时候明确要求不允许使用PE的方式;另外也有客户之所以反对PE,是因为他们觉得译员使用PE减轻工作压力是“投机取巧”。 这些问题导致这种工作方式难以在一些翻译公司大规模推广。 在阻碍PE推广和应用的因素中,很多都和译文的质量有关。很多客户之所以认为PE的译文质量不如“从零翻译”的,是由于MT存在一些典型错误和不足,这些有可能变成PE的陷阱,导致译后编辑员出错。如果译后编辑员能够有意识地关注这些错误和不足,就能更好地避免掉入陷阱,保证最终译文的质量。 对于机器翻译的错误,崔启亮(2014: 68~73)指出: 机器翻译输出的译文错误主要来源于复杂句式的逻辑和结构错误,例如省略、指代、并列关系错误,译文词义的选择错误,孤立的字词、句法结构转换错误,错误的形态等。具体而言,高质量的译后编辑需要注意译文是否存在语义、语法、语用、术语、拼写、标点、符号、数字、格式错误,增译,漏译,歧义,一致性,文化冲突等。 为了更好地帮助译后编辑员查找错误,笔者认为有必要更详细地总结一下机器翻译的典型错误。本文指出的这些错误具有一般性,是MT在翻译通用文本时有可能出现的错误(下文的举例中,原文标为SL,机器译文标为MT,人工译文标为HT)。 (一)汉语分词 汉语在书写的时候是以字为单位的,字和字之间没有空格。MT在进行汉英翻译(以及其他汉译外的翻译)的时候,需要先对汉语文本进行分词,把句子切分为以词为单位的语流。机器自动分词技术近些年来取得了很大的进步,但是仍然会出现一些误判。 比如,谷歌、必应等多款机器翻译曾经无法很好地翻译“请在一米线外等候”这句公示语,在自动分词的时候,把“米线”当作一个词,理解成了“noodle”或“rice noodle”(见图1)。② 图 1 谷歌误译示例 (二)代词 (三)亲属关系 (四)中国人名、古文、古诗词回译 (五)亚洲汉语文化圈中的名词 MT:他曾经是Sessho,为小皇帝Yozei摄政,881年他被任命为总理。 (八)量词、冠词等 (九)修辞手法 (十)源语文档原有错误需勘误 总体而言,在MT,尤其是NMT的基础上进行PE,蕴藏的危险如下。 (1)NMT的结果更为通顺流畅,有一定的麻痹作用,使得某些译员直接通过机器翻译译文,而不去认真审读原文,从而无法发现一些错误。 (2)在工作量较大的情况下,从事译后编辑的译员有可能漏改个别句段,留下纯机器翻译的语句,被客户发现导致投诉。 (3)机器翻译的译文越流畅,越容易掩盖机器翻译留下的“陷阱”。没有经验的译员,或是部分高水平译员在工作压力下,无法有效识别错误,尤其是“伪友”类错误,造成误译。 (4)机器翻译的译文越流畅,初级译者越不知道如何改,导致译文的同质化,或是带有“译后编辑腔”。 目前,对于翻译能力的分析,PACTE Group(2003: 43-66)的模型影响较大。这一模型将翻译能力分为双语能力、语言外能力、策略能力、工具能力、对翻译的认知以及生理和心理要素等。 对于译后编辑能力,很多研究着眼于对PACTE模型中的“工具能力”进行补充,提出了机器翻译知识、术语管理能力,甚至编程能力等。比如,O’Brien(2002: 99-106)认为,译后编辑员除了具有源语与目的语应用能力、专业领域知识、文本类型与对比知识、工具运用能力等之外,还需掌握机器翻译知识、术语管理能力、译前编辑/受控语言写作能力、基本编程能力、语篇语言学知识等,还要会使用宏命令,为机器词典编码,对机器翻译抱有积极态度,能够容忍低质机译产出等。这一观点虽然对译后编辑能力要素的概括较为全面,但同时比较零散。冯全功、刘明(2018: 57~63)则提出了包含认知维度、知识维度和技能维度的译后编辑能力三维模型(见图2)。
冯全功、刘明提出的三维模型对于考查译者是否具有译后编辑的能力具有较大的指导意义。可惜的是,其构建的图表实际上只是一个二维平面模型,并非论文所述的“三维”。在实践中,我们发现,在技能维度、知识维度和认知维度三个维度中,技能维度的各种要素易于培养,而其他两个维度的能力其实仍然属于传统的“人工翻译”的认知和知识维度,属于译后编辑所需的特殊知识和认知内容,虽然有,但所占的比重极小。 比如,认知维度中的“态度与信任”有一部分属于译后编辑员特有的要素(在传统翻译所要求的态度的基础上增加的):“[译后编辑员]相信机器翻译可以有效提高工作效率,不要抵制与轻视机器翻译,同时不苛求机器翻译的质量,善于控制对机器翻译的负面情绪。”(冯全功、刘明, 2018: 57~63)分析一下我们会发现,相比于同一维度中的其他几个要素,如问题解决与决策行为、信息加工与逻辑推理等,对译后编辑模式积极的态度与对机器翻译的信任是一种主观态度,通过实践获取积极体验后较容易建立起来。而其他要素则是传统翻译同样需要的要素,培养与建立都需要非常漫长的过程。 在知识维度中也存在这一问题:凡是与传统翻译所共需的要素,形成能力结构都需要较长时间,习得也较为困难;凡是译后编辑所特有的要素,形成能力结构则相对简单,所需的学习时间和训练时间较短(见表1)。基于此,笔者认为优秀的译后编辑员的基本能力结构,与优秀翻译人员的基本能力结构相同。 表 1 译后编辑能力要素培养所需时间对比 NMT取得的进步有目共睹,但是,这种技术也给翻译人才培养带来了一些隐忧。近两年来,笔者在与国内翻译教育者交流的过程中,发现目前的外语和翻译学习出现了两个令人担忧的现象。一是某些学生在语言学习的基础阶段借助NMT辅助外语的写作,即先用母语写作初稿(部分或全部),然后在NMT的基础上进行修改。二是做翻译作业的时候使用完全译后编辑的方式。笔者还曾听到两个翻译硕士专业的同学在讨论软件用法时说如果英语的用户手册读起来觉得吃力,可以“先用机器翻译转换成汉语”。这种做法,无疑是外语和翻译学习者最不应该做的事情,即借助MT来实现对外语文本的“理解”。如前所述,译后编辑员的核心能力与译员的核心能力无异,且都需要长期训练才能习得。如果语言学习者在基础阶段就无原则地借助MT来完成写作以及翻译训练,是不可能形成译后编辑所需要的双语能力的。 越来越先进的神经机器翻译还带来了另一个隐忧:MT译文表面上非常流畅,会让初中级水平的译者满足于获得“差不多”的译文,因此其自身的翻译水平长期停留在初中级水平上,无法成长为高级译员或者译审。 面对这些问题,笔者认为,一个合格的译后编辑员的成长路径,应该经历三个阶段: (1)足量的“从零开始”的翻译实践及质量反馈; (2)足量的译后编辑实践及质量反馈; (3)适应并习惯基于NMT的译后编辑。 这里使用了“足量”一词实在是不得已而为之,因为影响一个人翻译能力的因素过多,很难对相关的因素进行量化。实际上,谈及翻译实战训练的作用,现有的文献基本上都是采用经验主义的说法。如,全国翻译专业学位研究生教育指导委员会规定翻译硕士(笔译)在校期间的训练量为15万字;许多资深的翻译从业者及翻译教育者认为,翻译工作量需要超过50万字甚至100万字,才算完成基础阶段的实战训练,成长为基本合格的、能够独立工作的译者。笔者个人的翻译实践也基本支持这一判断。所以,此处只能暂时采用“足量”这一模糊的说法。 根据目前机器翻译的发展趋势,我们认为,未来简略译后编辑会随着AI以及MT的进步而逐步消失,因为MT的质量不断提高,越来越接近人工,目前需要简略译后编辑来做参考的翻译客户,会渐渐发现单纯的机器翻译就能达到这样的要求。随着更多的翻译客户、译员以及翻译服务企业接受、使用译后编辑的生产模式,完全译后编辑的应用前景会越来越广阔。目前,“机器翻译质量不断提高以及高水平译员供不应求之间的矛盾”成了翻译服务企业所面临的主要矛盾之一。要想解决这一矛盾,当务之急还是加强高水平语言人才的培养。在培养高水平的完全译后编辑人员的时候,应该遵循一个基本原则,即“先成翻译良才,再尝试PE”,简言之“先成才,再PE”,即先要成为高水平的双语应用者、合格的译者,再学习掌握译后编辑的其他技巧和能力。此外,在进行PE的时候,译员还要将“改错”的心态转变为“雇用助手”的心态,要把MT当作自己的帮手,而不是麻烦制造者。做PE的时候不是单纯地“改错”,而是寻找MT中的可用元素,融合到自己大脑生成的译文中。 *注: ①见 https: // googleblog. blogspot. com / 2009 / 06 / translating-worlds-information-with. html。 ②经检查 , 目前谷歌 、必应 、有道 、百度等机器翻译已经能够正确处理这句公示语的翻译。 如2012年12月14日 , 谷歌将这句话翻译为 “ please wait outside the one-meter line”。 ③这段报道2019年12月10日在 https: // mil. news. sina. com. cn / world / 2019 - 03 - 15 / doc-ihrfqzkc4102872. shtml 仍然可以看到。 ④https: // www. nzherald. co. nz / nz / news / article. cfm? c_id = 1&objectid = 12213070. 基金项目:本文系2015年国家社科基金项目“汉学文史著作平行语料库建设及在中国文化外译中的作用研究”(15BYY093)、2016 年山东省专业学位研究生教学案例库建设项目“ 旅游图书翻译案例库”(SDYAL16042)、2018 年山东省专业学位研究生教学案例库建设项目“二战史双语语料库及翻译案例库”(SDYAL18037)的阶段性成果。 参考文献(上下滑动查看) [1] 崔启亮, 2014, 《论机器翻译的译后编辑》, 《中国翻译》第 6 期。 [2] 冯全功 、刘明, 2018, 《译后编辑能力三维模型构建》, 《外语界》第 3 期。 [3] O'Brien, S. 2002. “Teaching Post-editing: A Proposal for Course Content,” Paper Presented at 6th EAMT Workshop Teaching Machine Translation, UMIST, Manchester, England, November 14-15. [4] PACTE Group. 2003. “Building a Translation Competence Model,” in Alves, F. (ed. ). Triangulating Translation: Perspectives in Process Oriented Research, John Benjamins. 作者简介 徐彬,山东师范大学教授,主要研究方向为翻译技术、应用翻译等; 宋爽,山东师范大学 讲师,主要研究方向为应用翻译等。 特别说明:本文发表于《翻译与传播》2021年第1期(总第3期)第111-126页,本次推送获作者授权,引用请以期刊版为准。 |