WITTA翻译技术教育研究会
Translation Technology Education Society

翻译技术教学新谈

作者:徐彬 郭红梅

摘要:翻译技术近年来受到了语言服务产业从业人员以及翻译培养单位的重视。但是,仍有一部分翻译教育专家认为,与翻译相关的各种计算机技术不用教。本文基于近20年从事翻译技术教学的经验,通过观察和思考,指出有组织的教育活动可以大大提高翻译技术的传播效率;翻译技术教学不应拘泥于软件应用的培训,而是培养借助软件解决翻译实际问题的意识,培养创新精神;翻译技术应用能力是翻译能力的有力补充,能够促使翻译学习者尽快适应现代语言服务产业的生产流程。

近年来,以计算机辅助翻译为代表的翻译技术等在国内得到了广泛的传播,技术思维、技术应用的价值得到了越来越多翻译教学和研究者的认可。但是,与此同时,在一些学术会议以及翻译沙龙等场合,我们也经常听到有专家发言说,计算机辅助翻译其实不用教;也有人说:“我们学校从来不教计算机辅助翻译,但是我们的学生到了工作岗位上,自己就能学得很好。”在笔者加入的一个微信群里,也有人提出,CAT教学固然是必要的,但是有的学校还在CAT课上讲Word应用,实在是没有必要;还有一位专家抛给大家一个问题:如果有两个翻译硕士的毕业生,一个是翻译的功底好,但是技术不好,另外一个是翻译的技术好,但是翻译的功底不好,用人单位会要哪个呢?

这些问题引起了一些CAT教学工作者以及MTI学员的困扰笔者觉得有必要认真对待结合我应用CAT从事CAT教学和研究近0年来的经验和观察阐述一下我的观点

有组织的教育活动的必要性

对于计算机辅助翻译要不要教的问题想要作出合理的回答我们首先要回答另外一个问题为什么要有学校的存在?为什么要有不同级别的学校?学完了小学初中为什么还要进入技术学校或者继续读高中进而进入大学继续学习?进入信息时代以来尤其是互联网普及之后我们发现一个人只要拥有了电脑拥有了上网条件他就拥有了人类迄今为止几乎所有的知识但是互联网并没有把学校给打败学校依然存在学校的意义主要在于第一提高知识传递的效率让有经验的人把经过长期摸索积累起来的经验或者掌握的知识高效地传递给学习者第二学校教育可以教给学生更全面更体系化的知识避免出现信息的孤岛第三学校教育可以让同龄人聚在一起充分研讨激发创新的火花世界上几乎所有的古代文明其创新的速率都远远低于当代这其中与信息流通不充分学习知识的人无法聚合到一起有着明显的关系第四学校教育可以批量生产适宜社会化协作的人才

技能知识的四个阶段

由于有了有组织教学的存在社会机构就能有指导性地甚至是强制性地传播某些相关技术和知识的方式如果没有学校教育可能有的人毕生都不知道存在某种技术更遑论学习掌握它了意识能力学习模型Conscious Competence Learning Model又称作Four stages of competence能够让我们看清楚这一点

该模型最初称作学习新技能的四个阶段”,是戈登培训国际Gordon Training InternationalNoel Burch2世纪70年代提出的Wikipedia1970)。该模型提出个体最初对于自己的能力欠缺是无知”,或说是意识不到的当个体认识到自己的能力欠缺之后才能有意识地学习并有意识地运用新的技能对一个领域的知识或一门技能初学者从一无所知到熟练掌握需要经历四个阶段见图

翻译技术新谈1.png

能力的四个层次笔者据Wikipedia绘制

第一阶段叫做对能力欠缺无意识”,即对于自己在某一方面知识或能力的欠缺毫无意识一个翻译界的同行曾用俗话来解释这一现象就是不知道自己不知道”。要想学习掌握一门技术个体必须认识到自己的能力欠缺以及新技能的价值才能产生学习的动力对比这一理论化的描述可以看到若不是翻译硕士专业的发展提出了对计算机辅助翻译教学的要求而且若不是这几年从事翻译技术研究和技术传播的人员大力传播和宣传这样的技术国内翻译界恐怕根本不会讨论计算机辅助翻译要不要教的问题——原因就是假设教学和传播缺位大部分的翻译研究者和教学人员恐怕还不知道存在计算机辅助翻译这样的技术就更谈不上讨论其用不用学”、“用不用教处于这一阶段的人容易产生所谓错误的直觉”,涉及翻译以及翻译技术具体表现就是以为做翻译用Word打字就已经很高科技其他的专用技术都是添麻烦”。应该看到对于绝大部分的知识和技能如果缺乏相关的教学极少有人能够无师自通有的翻译领域的专家说计算机辅助翻译软件其实和Word一样一边用一边就会了但是这些专家可能不知道另外一个说法那就是80Word用户其实只知道它20的功能”。而恰恰是那些他不知道的功能有可能会对生产力带来极大的提高这方面的案例不胜枚举比如目前看似非常简单也非常基本的Word修订功能2000年的时候我在自己所在的学院办过专场讲座使得这一技术传播开来大大提高了文稿审阅的效率而直至2017笔者还遇到过有翻译专业教师问我Word批注修订了文档之后如何抹除标记?也有的问我带有修订标记的文档能否查看没有标记的修订前以及修订后的状态?以笔者多年的教学经验看类似的单凭用户感悟难以接触并掌握但是对于学术写作和翻译工作有重要价值的Word高级技巧包括

Word大纲视图模式大纲视图可以说是Word中最少被用户使用的视图模式但是不掌握这一视图模式就无法深刻领会文本即数据的结构化文档的精髓同时也必须在掌握这一视图模式操作的基础上才能应用下面提到的主控文档子文档功能

主控文档子文档的功能在管理长篇文档的时候Word推荐用户使用主控文档和子文档的模式这样可以避免文档过大导致占用过多内存打开和编辑缓慢掌握好这一功能可以将其用于拆分长篇文稿翻译做准备而当翻译完成后又能借助这一功能迅速将化整为零的译稿合并成完整的大文档这就能避免采用逐一打开文档和反复复制粘贴等出错率高的操作同时大大提高文档拆分与合并的效率运用熟练之后译者可以在十分钟内将近千页的文档按一级标题章的标题拆分为小文档此外作为学术研究者了解了两种功能并能将它们充分融合使用可以大大加快长篇学术报告论文等的写作尤其是多人协作下的写作

Word的高级替换功能Word除了能够查找逐个或批量替换文本外还能查找替换一些特殊符号灵活利用这样的替换尤其是配合通配符就能快速把网上常见的不规范的词汇表整理成有规律的术语表便于导入CAT 的术语库同样利用Word的文本和表格互转的功能以及这一功能内部的规律还能巧妙实现现有的两个语言文档的双语逐段对照

宏是令大批Word用户感到很神秘且从未尝试过的功能。“这个名称本身有种神秘主义的色彩原本起这样一个特殊的名称可能是为了吸引用户关注但实际情况却不如开发者所料大批的用户为名字所惑并止步于此通俗说来宏就是命令集合”,是把一系列规范化的操作步骤用电脑的语言描述记录下来便于重复使用考虑到一般用户不会电脑语言MS Office开发者提供了一种录制宏的方法就是由用户做给Office软件”,软件负责把操作用代码记录下来上述提及的操作很多都是规范的操作就可以录制为宏便于日后使用笔者日常处理翻译资料常用的宏就有两个一个是术语整理宏另一个是笔者独创的利用Word文字和表格互转功能实现的为现有文档添加隐藏段落的功能比如ABC三个段落通过宏可以变成AABBCC每段重复一遍第一次出现是隐藏文本第二次是正常文本这样处理后的文档CAT中翻译完成后可以获得原文与译文逐段对照的格式。(修订和审阅功能很多用户觉得这个功能不神秘”,算不上多么高级的功能但是我的一个操作就曾让一个原本觉得非常了解这一功能的用户发现电脑的应用是充满创新的众所周知Word有批量替换的功能这一功能是把双针对大量文字如果批量替换不慎有可能造成误伤的情形因为一些情况下我们要查找的字词可能是某个更长的表达法的一部分作为独立的词其需要替换但是作为更长的表达法的一部分则不应替换为了避免这一问题我在对译稿做批量替换的时候总是先打开修订功能这样替换后所有被替换的文字会有修订标记我们就可以重点审阅一下在所有的替换中是否有不应替换的实例上述这些技巧如果不是通过精心设计的教学恐怕80的用户一辈子也摸索不到还能这么做市面上大量的Word技巧书也充分说明了,“简单Word也需要学习需要教授只不过这个教与学可能不是传统的方式

第二阶段叫做对能力欠缺有意识”。在这个阶段学习者知道自己的无知不足”,也认识到了新技能的价值知道该去学习什么但暂时还不知道如何去做一件事计算机辅助翻译教学的基础阶段就是要解决这一层次的问题在这一阶段出错是学习中不可避免的处于这一阶段的学习者容易产生所谓错误的分析涉及翻译技术具体表现就是个人才刚刚接触CAT对翻译记忆的概念还没有充分掌握就忙不迭地耗费大量精力去搜集语料库术语库”,以为只要我拥有了大数据”,就可以解决翻译中的很多问题大大提高翻译效率和质量具体表现就是在国内CAT技术传播的早期阶段2000年前后),很多刚接触CAT的译员热衷于将金山词霸等电子词典的词典文件通过反向工程的方法剥离出纯文本的数据并进行数据整理导入到CAT工具的术语库中以为手头握有几十个专业的超大规模的术语库翻译中的专业术语问题就能迎刃而解殊不知,“大数据不是数据的堆砌而是数据的管理和筛选以及数据的计算处理)。盲目扩大翻译的记忆库和术语库会让大量无效的数据混进来,“污染数据库最终给翻译项目带来危害总体而言漫无目的地扩大数据其投入产出不成比例是一种错误分析导致的错误行为

第三阶段叫做对能力有意识”。在此阶段学习个体理解或知道了如何做一件事但是知道何为正确的并不意味着就能自然地做到还需要学习者付出时间和精力去学习掌握这一阶段的关键就是通过实践”,暴露和发现自己的错误并进行修正处于这一阶段的学习者已经能够根据所掌握的知识和技能做出正确的分析比如作为CAT应用和研究领域最早一批进入这一阶段的人国内外很多CAT的研究者都曾指出CAT应用于翻译翻译记忆库未必是效率提升核心的技术和资源术语库的作用往往更大

第四阶段叫做对能力无意识”。学习者在经过大量训练后一项技能就有可能成为其第二本能”,可以信手拈来到此阶段学习个体就具备了他人的资格处于这一阶段的个体由于形成了知识网络多领域的知识和技能能够融会贯通就能够帮助他们形成正确的直觉笔者的CAT应用研究成果中有三个创新观点可以归于这一类:(首先提出CAT可以用于创造性文本文学社科文献等的翻译;(率先将基于统计的机器翻译MT与译后编辑结合应用到文学和社科图书翻译中证明行之有效;(2004年就提出除了翻译的文化转向外当时的翻译界还在经历技术的转向从那时起到现在的翻译技术教学与研究的活跃已经清楚地证明了这一点

任何专业技术的学习尤其是要想达到专业的水平其学习过程如果不是通过精心设计的教学来完成而是纯粹靠自学往往会浪费时间走弯路个别情况下甚至会造成严重的后果前面提到的CAT刚开始传播时的一个典型案例就说明了这一点那时候很多刚刚接触CAT的人发现了术语库的价值于是高度兴奋地拿出大量的时间尝试将各种词典转换成术语库耗费大量时间导入到CAT软件术语库实际的结果却是事与愿违因为术语表不等于词典这样一个简单的道理是术语学中的一个基本原则但是对于初学者来说在无人指导的情况下却需要付出大量的时间和精力才能领悟到这样一种认知如果不是通过教学获得而是通过实践自己摸索获得那么就不能不说是一种时间上的巨大浪费

3.CAT用户为何要成为Power Word User

除了质疑CAT教学的必要性之外有些翻译教学和研究者在认识到CAT有必要教之后质疑一些CAT课程的内容最典型的是认为Word不用教”,提出CAT课就是要教CAT软件的用法拿出那么多时间讲Word不是办成电脑文字处理培训班了?

其实对于绝大多数的译员和翻译学习者来说他们掌握的Word技巧不是太多而是太少了实际工作中笔者见到过很多用户由于不了解Word的高级替换自动提取目录自动生成索引交叉引用等高级功能面对一些应用需求时或是拼时间拼体力用笨办法解决或是束手无策更为遗憾的是在翻译服务领域一些用户满足于知识和技能够用”,面对实际问题的时候技能捉襟见肘导致整个流程的技术处理磕磕绊绊浪费时间不说甚至会带来无法按期交付等严重后果

CAT应用熟练的人往往同时熟悉Office软件善于将各种软件的功能融会贯通方便工作很多研究者已经阐述过Word等文字处理软件的高级应用能力对于CAT整体应用的重要意义Lynn Bowker2002)、柯平参见朱晓敏2010)、徐彬2010这些应用能力往往是花费多年才积累养成的既有单纯的技巧也有综合思考创新的结果如果要重新发明车轮”,学生中综合素质较为优秀的人往往也要花费成倍的时间才能摸索掌握而有了教学则可以达到让一部分学生一点即通的效果大大提高技能传授的效率甚至是教会学生一种思维方法更重要的是就像笔者在上一部分提到的某些技巧是把多个功能创造性组合在一起或是将原本为其他目的设计的功能应用到翻译实践中这些高级用户结合实际需求思考的结晶通过教学传播显然是经济的方

虽然说针对多款现代CAT软件进行十几个小时左右的培训就能让一般学员掌握基本用法但是如果没有高级技能的培训辅以实际的案例),则下一步每个学员都有可能为了寻求售后服务”,占用高级用户成倍的时间因为实际的翻译工作中译员面临的文件类型客户需求等具体问题层出不穷这些问题不可能由十几个小时的软件基本应用培训所涵盖只有通过工作坊式的学习通过真实案例的训练才能最大限度穷尽可能性找到潜在的问题而最关键的是通过实操使学生也具有创造性地解决问题的能力此处仅举一部分CAT应用中的典型问题来说明CAT教学的必要性

项目文件损坏很多CAT 软件都是基于数据库的数据库文件在经过压缩和解压缩以及网络传输等过程后有时会出现文件无法打开的问题通过网上的一些CAT论坛笔者发现实际工作中很多用户卡在这样的问题上造成数据的丢失而实际上针对此类问题我们可以根据具体情况采取不同的解决方案有的软件提供了数据库修复工具比如DéjàVu),有的可以通过重建新的项目借助仍然能够使用的记忆库找回所有译文

标签过多影响翻译这往往出现在两种情况下第一种是译者直接将PDFWord格式不经过文档清理等重排版工作直接导入翻译项目缺乏经验的CAT用户往往轻信并依赖一些CAT软件提供的PDF转换翻译功能给翻译的译中和译后阶段带来无穷无尽的麻烦)。另一种是汉译英文档虽然源语文档是Word格式的但是由于Word知识欠缺未经重新排版导入翻译项目后产生大量标签默认情况下Word对于文件中的汉字采用汉字字体期间夹杂的阿拉伯数字和西方文字的字符则使用Times New Roman等字体这种文档在导入CAT翻译项目时字体的转换就会以格式标签的形式反映出来造成大量影响翻译进度的标签

对于长篇Word文档翻译过程中往往需要拆分为多个文档如果不具备高级的Word应用技术拆分文档就会是一个复杂而且充满了机械性重复的过程而如果掌握了Word高级技巧就能够通过主控文档子文档管理的方式在几分钟到几十分钟内处理完成数千页的大型文档的拆分

遇到新问题无法寻求最佳解决方案Epubmobi等是新兴的电子书格式在实际的图书翻译工作中译者越来越多地接触这类格式的源语文档对于如何处理这种文档笔者曾读到一位译者的博客文章介绍了他的经验上亚马逊网站购买Kindle的电子书使用iPad版的Kindle阅读软件打开iPad上对每一页进行截图最后通过扫描识别软件OCR来转换这种方案看似巧妙实则麻烦绝大多数电子书文件可以通过专用的工具高效快捷地转换为Word等格式如开源软件Calibre对于epub格式的电子书甚至能够通过解压缩的方式提取出书中每个章节的独立文件直接进行翻译一些软件的某些功能表面上看似乎和翻译活动无必然之联系然而一旦做到了融会贯通便可以某种巧妙的方式促进译员的工作或加快其工作进度或改善工作成果的存储和备份效果以降低灾难性事件发生的几率或加快成果的传递不一而足

4.CATWord的学习曲线对比

Word不一样CAT 的学习曲线非常陡峭Word这款软件只要安装好初次启动用户面对的就是一张白纸”,就可以通过键盘输入文字配合基本的电脑操作常识知道如何保存文件这时候很多人就会沾沾自喜会用Word虽然实际情形并非如此如本文多处所论及)。

翻译技术新谈2.png

 WordCAT学习曲线对比

笔者试着以WordCAT学习曲线对比示意图来说明这一点从图可以看出相对于最下方的能力基线CAT学习者第一次面对CAT软件是真正的零起点”,Word用户借助基本的电脑操作知识会感觉具备了一定的能力,“会用WordCAT用户需要经过阶段的一段陡峭的学习曲线才能成为基本会用CAT 的初学者这是因为CAT用户一开始就需要至少掌握翻译项目翻译记忆库以及术语库的概念以及相互之间的联系掌握这三者的创建方式掌握如何利用翻译记忆库和术语库为翻译项目服务学习这些内容CAT用户需要一开始就经过阶段的陡峭的学习曲线这也是为什么有很多CAT初学者往往顾此失彼且执行翻译项目失败的原因所在此后在阶段Word用户和CAT用户的学习曲线都比较平缓一些知识和技能能够通过实际的使用慢慢掌握不断丰富起来到了阶段由于翻译实践的需求会对CAT用户的能力提出更迫切的要求此时CAT用户经历另一个陡峭的学习阶段迅速上升为CAT的高级用户达到能力层次的第三或第四层级这一层级的典型表现是可以熟练运用多款CAT软件和相关工具优化翻译流程并指导团队充分应用翻译技术提高效率甚至胜任CAT的教学工作

这里需要特别提一下一些CAT软件为了吸引用户提供了直接打开待翻译文档进行翻译的功能躲开了有点繁复的项目创建过程使CAT的学习曲线似乎变得平缓了但实际上中学习CAT的两段陡峭的曲线仍客观存在这样做只是推迟了第一个陡坡出现的时机无论如何如果CAT用户不知道创建翻译记忆库和术语库不知道这两个库保存在哪里就无法有效地维护自己的语言资产我在教学过程中都是通过一个品字形示意图来说明借助CAT软件翻译的时候翻译项目翻译记忆库和术语库之间的关系见图)。其中翻译项目是一个容器可以装下导入各种该软件所支持的文件TMTB为项目的进行提供辅助减轻译者的负担在指导学员创建翻译项目执行翻译项目的过程中通过反复强调这个品字图就能迅速让学员建立起利用数据库来支撑翻译工作的思想近年来随着对MTPE模式尝试的深入我进一步提出原来的品字图中间可以增加一层那就是MT因为如今对于越来越多的翻译项目来说MT提供的辅助已经超过了TM TB的作用见图)。

翻译技术新谈3.png

 体现CAT翻译项目三要素的品字图

但是由于应用Word在处理各种文稿的过程中即使不掌握高级技术单凭时间的投入笨办法”,往往也能满足应用的需求所以绝大多数Word用户会停留在阶段认识不到Word还有高级技巧”。在电脑应用领域人们经常用80/20规则来描述这一现象80Word用户只知道其20的功能

翻译技术新谈4.png

 CAT翻译项目三要素品字图的进化版

自学由于其天然的局限性易形成孤岛化的信息工作中我们经常见到有对CAT掌握不充分的人因为操作失误而无法导出译文有人误删除了项目却不知道利用尚保存在电脑上的翻译记忆库恢复译文有因系统机导致翻译项目无法打开无可奈何……。这其中的大部分问题如果参与过合格的教学课堂研讨过就不会造成严重的后果而任何学问如果全凭自学缺乏认知达到了第二部分所说的第三甚至第四层级的明白人指点就极易造成知识孤岛这也是为什么不参加标准的学校教育难于成才的原因你可能凭自学掌握了不少东西但这些东西很可能缺乏系统性构不成知识的网络也就无法激发出创新

翻译技术和翻译能力孰轻孰重?

回到本文开头提到的一位专业人士提出的翻译技术和翻译能力的二元对立问题翻译公司在选择人才时到底是选翻译能力强的毕业生还是选技术能力强的毕业生?

其实这是个伪命题首先翻译技术和翻译能力的习得不是互斥的不存在为了学习翻译技术就得舍弃翻译能力的训练反之亦然另外二者所需的训练时间差异巨大翻译能力的培养需要十余年的功夫而翻译技术能力的培养往往只需要几十个到几百个学时加上一定量和一定时间的实践就可以所以用人单位在选择人才的时候如果没有翻译技术和翻译能力同时具备的人才自然倾向于选择翻译能力强的人因为术培训耗时较短对新入职人员拿出一定时间进行翻译技术培训用人单位能够负担得起而翻译能力培养耗时漫长用人单位是负担不起把一个本来没有能力做翻译的新人重新培养为合格的翻译所需的时间和资金的投入的当技术能力好的人达到了一定的数量具有了一定的规模就会带来变革这就好像是20世纪80年代电脑刚刚开始应用到各个生产领域的时候那时候只是个别的专家使用电脑整个社会的信息应用无法展开而现在再看各行各业没有了电脑不懂电脑操作简直无法工作翻译专业的毕业生也一样当市场上80的毕业生在毕业的时候在离开校门的时候都已经掌握了一款或者数款CAT软件了解了利用翻译工具进行项目管理提高翻译效率的时候而有一部分人却不知道那么即使这部分人的翻译能力更好也很难向用人单位证明自己是更好的人选

翻译技术的教学与研究

2006年以来已经有多篇论文论述了翻译技术课程应该教什么以及如何教如徐彬20062010)、贺显斌2009)、钱多秀2009)、俞敬松和王华树2010)、张政和杨义宽2012)、张政和张少哲2012)、崔启亮2012等的文章都给出了各自的论述此处不赘述这里重点谈一下翻译技术与翻译研究相结合可以产生一些创新性较强的科研选题而翻译技术教学如果成功也能促进教学中翻译专业学生的创新能力以我主持的2015年国家社科项目汉学文史著作平行语料库建设及在中国文化外译中的作用研究15BYY093)”为例其设计思路就是将语料库建设和翻译技术结合起来为中国文化外译工作提供帮助此外我还主持了2015山东省研究生教育创新计划基于网络及CAT技术的MTI团队合作翻译实训培养模式研究”(SDYY15101以及2016年山东省研究生教育提升项目的旅游图书翻译案例库建设设计这些研究课题都需要在技术方面真正做到融会贯通借助信息的系统化和网络化通过知识的跨界融合激发产生研究创新

结语

20年来CAT在中国的推广应用和教学实践已经表明CAT应该成为翻译专业教学的重要组成部分新时代的翻译教学和研究者是时候停止怀疑翻译技术纠结CAT用不用教这样的问题而是应该更积极地去接触新的翻译技术借新技术之力拓展研究的领域实现教学和科研新突破此外翻译技术的教学不应拘泥于软件应用的培训而是培养借助软件解决翻译实际问题的意识培养创新精神当广大的翻译教学和研究者看到了翻译技术和翻译研究相结合所产生的创新以及未来研究的潜力的时候他们也就不会再动辄为CAT 用不用教这样的问题而苦恼了


来源:《当代外语研究》