王琳 翻译技术教育与研究
近年来得益于软件技术的发展、新算法的出现以及计算机性能的提升,机器翻译技术已经取得了巨大进步,得到翻译行业和客户的认可,成为高效率翻译流程的重要组成部分。但是,机器翻译产生的译文质量仍然无法达到职业译者人工翻译的程度。为了实现译文质量和翻译效率之间的平衡,发挥人机交互的优势,译后编辑成为翻译服务行业积极采用的翻译实施方式。
一、什么是译后编辑
要准确理解什么是译后编辑,需要准确理解机器翻译的定义。根据ISO/DIS 17100:2013 标准的定义,机器翻译是“使用计算机系统将文本或语音从一种自然语言自动翻译为另一种语言”。译后编辑是“检查和修正机器翻译的输出”。译后编辑可以分为狭义的译后编辑和广义的译后编辑。前者指直接通过机器翻译得到的译文进行译后编辑,后者指对翻译记忆、机器翻译和翻译管理系统组成的集成翻译环境得到的译文进行译后编辑。
二、译后编辑发展趋势和动力
全球知名翻译社区Proz.com(2013)的2012 年全球自由译者报告显示,译后编辑作为一项服务提供的译者数量从2011 年的30% 增至40%。据Nimdzi近期发布的全球语言服务提供商(LSP)Top100榜单中数据显示,2021年提供机器翻译和译后编辑(MTPE)服务的公司数量增长了7.5%。
译后编辑发展前景广阔,一些重要因素促使译后编辑飞速发展。第一是由产品全球化与本地化的蓬勃发展,产生了大量的翻译需求,而这种需求是人工翻译远远满足不了的;第二是对所译材料类型和质量需求的变化,如对机器翻译质量期望值的降低,概要翻译的出现等。此外,产品发布周期越来越短以及企业对产品翻译预算的缩减也是促使MTPE发展的重要动力。
三、CAT软件译后编辑功能简介
memoQ、MateCat、Trados Studio、Memsource 等桌面翻译软件或云翻译软件提供的都是集成翻译环境,即同时具备机器翻译、翻译记忆和译后编辑功能。这些翻译软件不乏相似之处,而其译后编辑功能又各具特色。
1 memoQ译后编辑功能
memoQ 软件集成了谷歌、微软、DeepL、KantanMT 等19 个机器翻译插件。通过Intento 或 Tmxmall 机器翻译插件,用户可以“一站式”使用谷歌、微软、DeepL 等国外机器翻译引擎以及百度、搜狗、有道、阿里、腾讯等国内机器翻译引擎,不需要再逐一注册账户。
memoQ 软件支持用机器翻译进行预翻译,然后根据译文质量要求,采用轻度译后编辑或完全译后编辑的方法完成译文的编辑工作。译后编辑工作界面是译员和审校人员非常熟悉的编辑器界面,在这个界面中,译后编辑人员可以对机器翻译的初始译文进行添加、删除、替换等操作,也可以参照术语建议修改术语。质量保证功能可以实时发挥作用,预览功能方便编辑人员查看上下文语境和译文格式。所有编辑修改的内容都能以跟踪修订的方式直观地显示出来。
2 MateCat译后编辑功能
MateCat 是一款免费开源的云翻译软件,目前集成了Google、Microsoft、ModernMT、MyMemory 等13 个机器翻译引擎,还有一个包含120 亿句对的公共翻译记忆库供用户免费使用。
在MateCat 的编辑界面打开原文时每个句段都会自动添加机器翻译译文或翻译记忆库匹配译文,不需要进行任何预翻译操作。此外,译文句段下方列出了译文匹配的来源,即机器翻译匹配、私人翻译记忆库匹配或公共翻译记忆库匹配。这种译文呈现方式为广义的译后编辑提供了极大的便利,译后编辑人员可以在机器翻译译文和翻译记忆库匹配译文之间进行比较和取舍。每个句段下方也列出了术语匹配的内容。对文本内容的编辑修改、文本格式和标记(tag)的处理都非常简便。
3 Trados Studio译后编辑功能
Trados Studio 软件默认仅集成了SDL Language Cloud 和SDL 机器翻译(企业版)两个机器翻译引擎,但用户可以通过RWS AppStore(应用商城)添加和使用几乎所有的机器翻译引擎。
在RWS Language Cloud 页面中可以选择“翻译引擎”或“SDL 机器翻译”,前者集成了机器翻译引擎和用户个人的云翻译记忆库与云术语库资源,后者则是纯机器翻译引擎。具体编辑操作流程与前文介绍的memoQ 和MateCat 类似,不同的是在Trados Studio 机器翻译中,除了可以选择通用神经机器翻译模型之外,还可以选择自适应机器翻译模型。
目前机器翻译最大的痛点是尚未实现在翻译的过程中进行学习,因此同样的翻译错误会反复出现。自适应机器翻译就是针对该问题的一种解决方案,它能够实时记录译后编辑人员所作的每个编辑修改并将其应用到随后的翻译中。下图是使用自适应机器翻译 引擎的翻译结果,包括初始译文和逐句编辑修改的情况,在原文和译文之间会显示句段状态列,其中的AT 和灯泡图标表示这些译文来自自适应机器翻译引擎。
4 Memsource译后编辑功能
Memsource 集成了35 个机器翻译引擎,拥有 “AI 驱动的非译元素”功能和“机器翻译质量评估”(MTQE)功能。
AI 驱动的非译元素功能不仅能够识别传统的非译元素内容,还可以识别人名和产品名称等新内容,它最大的优势在于可以像翻译记忆库一样提供一个匹配值,表明某个句段“确定是”非译元素句段(匹配值100%)或“可能是”非译元素句段(匹配值95%-99%)。使用该功能可以在译前自动识别出原文中只包含非译元素的句段,并对这些句段进行预翻译,从而提高译后编辑效率。
MTQE 功能可以为机器翻译的输出提供句级质量评估,方法类似于翻译记忆库匹配。虽然目前机器翻译的输出质量在总体上有了较大提升,但因为内容类型和语言对不同,翻译质量并不稳定。因此,译后编辑人员经常要面对很多低质量的机器翻译译文,编辑这样的译文非常浪费时间。同翻译记忆库匹配值相类似,机器翻译译文质量的自动评分有助于预估译后编辑的工作量,并能降低译后编辑的工作强度。此外,MTQE 功能还可以实现针对特定内容和语言对的机器翻译引擎优选。
四、总结
机器翻译与译后编辑相结合的模式迅速发展,它既充分发挥机器翻译的速度,也充分发挥人工翻译的精度。译后编辑模式既满足了翻译市场快速发展的需求,也推动了翻译技术的发展,还促进了学界和业界的交流与合作,丰富了语言服务产业链的组成。对于译者来说,掌握CAT软件译后编辑功能,将为翻译工作提供极大助力。
文章来源
[1]崔启亮.论机器翻译的译后编辑[J].中国翻译,2014,35(06):68-73.
[2]周兴华,李懿洋.计算机辅助翻译软件的译后编辑功能探究[J].北京第二外国语学院学报,2021,43(05):52-65.
文字:王琳
排版:王琳
审校:李斯然
转载编辑:陈雨
关注VX公众号“语言服务行业”,了解更多语言服务行业与翻译技术相关的资讯和洞察~
网友评论