WITTA翻译技术教育研究会
Translation Technology Education Society

专访|魏勇鹏:机器翻译质量评估为什么重要?

微信图片_20220302160733.jpg

如今,人工智能的时代大势引发了深刻的技术革命、教育变革和数据革命,同时翻译技术也成为了翻译教学和实践中不可分割的部分,进一步推动了语言服务行业和高校教育的创新变革,促进了技术与人的和谐共生。为提升语言服务行业各方对翻译技术的认识和应用能力,加强语言服务人才的技术素养,加速语言技术成果的高效转化,整合当前优质和有效的翻译技术资源,推动翻译技术与翻译教学的融合发展,促进政、产、学、研的协同创新,WITTA翻译技术教育研究会(TTES)特别策划了【大咖专栏】,本期专栏将聚焦“机器翻译和译后编辑”,对话业界和学界的专家教授,聆听业内名家的精彩观点,洞见未来翻译技术发展趋势。


本期专访嘉宾是语智云帆、商鹊网创始人,世界翻译教育联盟翻译技术教育研究会(WITTA TTES)副会长,中文信息学会机器翻译专委会委员、中国翻译研究院术语管理技术顾问专家魏勇鹏老师,让我们来听听他对机器翻译与译后编辑的看法。


您认为当前机器翻译存在哪些技术瓶颈或问题,如何克服


机器翻译最大的技术瓶颈在于对大规模双语平行语料的重度依赖。虽然资源稀缺语种的机器翻译是目前研究的一个热点方向,但是从实际效果来看,翻译效果能让人觉得“惊艳”的,仍然是语料资源足够丰富(上亿或上十亿句对,至少是数千万句对)的语种对。语料规模是当前机器翻译“军备竞赛”的一个绝对门槛。这个门槛越来越高,后来者如果要超越,往往得有数量级上的语料优势,成本极其高昂。解决这个问题,一条路径是如果能有国家级乃至国际级的语料基础设施实现资源的共建共享,可望降低语料资源利用的门槛,但这从知识产权、组织管理、商业逻辑上都不好实现;另一条路径就是想办法从别的“知识”来源,比如知识图谱、大规模预训练语言模型、多模态语料库、人机互动行为大数据等,寻找可用的信息和有效的融合利用方式,但这些方面的资源构建同样门槛越来越高,如何有效融合也仍在前沿探讨阶段。

机器翻译的另一个技术瓶颈在翻译质量评测方法。翻译质量评测是机器翻译系统优化的指挥棒。如果能够实现可靠、高效、经济的翻译质量自动评测,那么就有可能通过增强学习的方式,比如对偶学习、生成对抗网络、教师-学生网络等,实现机器学习算法的自我进化,从而实现机器翻译的突破。但这个问题其实是与机器翻译本身同等难度的问题,实现起来也很不容易。更何况,我们对于翻译质量(不论是人工翻译还是机器翻译)的评价标准本身的研究尚浅,并没有形成本质的、量化的、全面的标准体系,这其实是语言学、翻译学的研究者们能够大展拳脚的一个空间。



机器翻译质量评估有哪些策略和方法?如何选择适用的机器翻译评价机制


器翻译质量评估通常有人工评估、有参考的自动评估和无参考的自动评估三种方法。我经常把这三种方法类比为三种不同的挑选苹果的办法,分别是“尝一尝”、“比一比”和“猜一猜”。“尝一尝”的方法最可靠,但成本也最高,咬一口你就得买。“比一比”就是拿一个“好吃苹果”的样本做比较,成本较为可控,但需要好的样本且知道比什么,才能挑出来。“猜一猜”主要靠历史经验,经验不丰富的人失手的可能性非常大。

上述三种方法各有优缺点,因而需要根据应用场景的需求灵活选择或组合。比如在多个机器翻译系统进行横向对比时,常用的是有参考的自动评估,辅以一定量的人工评估;而在对同一个机器翻译引擎的版本升级进行评估时,就反过来以人工评估为主,这样才能够更加可靠、敏感地捕捉到质量的变化;在对待翻译的内容进行评估以筛选出更适合MTPE模式的部分时,主要依赖于无参考的自动评估。



您认为机器翻译在垂直领域应用前景如何?


直领域的机器翻译一定是未来的发展趋势之一。因为在不同的垂直领域,翻译所面临的知识结构、语言特征、质量标准、应用场景都是不尽相同的,只有深入领域进行垂直定制,才有可能获得显著的提升,满足该领域的机器翻译应用需求。

语智云帆先后探索过多个不同的垂直领域,比如专利翻译、网络文学出海翻译等,每个领域都有其独特的需求和不同的实践方案,因而要做好垂直领域机器翻译,就不能停留在机器翻译本身,而要深入到该领域的业务链条中。反过来说,垂直领域的机器翻译也更迫切需要在知识获取、质量评测、用户交互方面有独到之处,因为细分到垂直领域,语料稀缺的瓶颈更加显著。从商业上说,找到一个足以支撑机器翻译高昂的研发和运营费用的垂直领域,也是一件不容易的事情,行业从业者仍在为此不断努力探索。


您如何看待机器翻译质量评估技术在翻译教学中的应用?


机器翻译质量评估技术在一定的场景条件下也适合于人工翻译的质量评估。翻译教学中涉及大量的质量评估反馈,这是质量评估技术能有用武之地的一个领域。例如在我们多年实践打造的试译宝平台上,通过有参考的自动评估方法,可以较为有效且高效的为学生的翻译练习提供更充分的反馈;而无参考的自动评估方法,也能在翻译实践和翻译项目管理等环节提供监督管理的手段。这些都有助于提升翻译教学的效果和效率,实现智能化的教学。此外,在翻译教学中有意识地培养学生机器翻译质量评估的意识和操作能力,也是提升翻译质量认知能力的有效途径,也有助于翻译教学更加体系化、标准化和数字化。



您如何看待机器翻译与人类译员的关系?在人机结合翻译中,人类译员与机器各扮演什么角色?


我知道你想听到的是机器翻译会不会或者何时会取代人工翻译的回答。这个问题其实已经不是问题,或者说从一开始就不应该这样问。机器翻译和人类译员之间不是谁取代谁的竞争关系。真正会发生竞争的,还是在人类译员与人类译员之间。如果非要考虑机器翻译,那就是使用机器翻译的译员和不用机器翻译的译员之间的竞争,或者善用机器翻译的译员和滥用机器翻译的译员之间的竞争。当机器翻译的质量较低的时候,使用机器翻译的译员被认为是不负责任、懒惰的,自然竞争不过不用机器翻译的译员。但随着机器翻译水平不断进步,情况就没那么简单了。翻译高手使用机翻往往是如虎添翼,而新手则更容易被机翻带入坑里,所以说机器翻译加剧了行业分化,提高了竞争的门槛。那么,人类译员与机器各扮演什么角色?这场戏里面所有角色都是由人来扮演的,机器只是各个角色手里的道具。