美文网首页语言·翻译翻译技术
闲话CAT(5):Déjà Vu——或许是最早的CAT支持下的M

闲话CAT(5):Déjà Vu——或许是最早的CAT支持下的M

作者: binich | 来源:发表于2017-06-14 09:35 被阅读0次

    Déjà Vu 有一个非常特殊的功能,就是能够把当前翻译项目中的每一个文件都导出为一种双语格式(Bilingual File),Déjà Vu X将其称作“外部视图”(External View)——这个名词其实比现在更流行的“双语格式”更易于理解。这种双语文件是以rtf格式保存的。rtf文件格式是Rich Text Format的缩写,即“富文本格式”。这是一种开放标准的文件格式,最典型的应用场景就是可以用Word等绝大多数文字处理软件将其打开并编辑。基于此特性,它往往用于不同的文字处理软件之间交流文件内容的一种形式,因为它几乎可以全面的再现绝大多数文字处理软件所呈现的版面格式等。

    导出双语格式界面

    RTF是Rich Text Format的缩写,意即多文本格式。这是一种类似DOC格式(Word文档)的文件,有很好的兼容性,使用Windows“附件”中的“写字板”就能打开并进行编辑。使用“写字板”打开一个RTF格式文件时,将看到文件的内容;如果要查看RTF格式文件的源代码,只要使用“记事本”将它打开就行了。这就是说,你完全可以像编辑HTML文件一样,使用“记事本”来编辑RTF格式文件。

    Déjà Vu导出的这种双语格式是一种表格,主要分为五栏。第一栏是每一句话的ID,也就是它的编号;第二栏是Source Langue,也就是原文;第三栏是Target Language;第四栏是Comments,用于在里面书写一些评语,第五栏是表示翻译的状态。导出的双语文件可以用Word、WPS、Open Office等打开进行编辑。

    Déjà Vu X3的双语文件导出对话框 Déjà Vu导出的双语文件格式

    设计这种双语文件格式的导出和导入功能,最初的目的是为了让未使用Déjà Vu的用户也能够参与翻译项目的审校工作。当一个文件的初稿完成之后,译者可以将其导出为这种双语文件,发给审校人员。审校人员不需要专门去学习或者安装Déjà Vu就可以在电脑上使用任意一款支持rtf格式的文字编辑软件打开编辑。这样一来,就可以让没有学过,也来不及培训Déjà Vu应用的译审参与到翻译审校的流程中来。

    在大约2005年前后,我开始注意到谷歌机器翻译已经有了根据它来做“译后编辑”(PE)应用价值。它所提供的译文虽然还很生硬,但是从里面已经能够采集到大量的可用语块,而且采集到的语块往往多于采用比较完善的术语库所能获得的文字数。这样一来,对于一个熟练的译员而言,在谷歌机器翻译的基础上进行编辑,稍加训练和适应,就能够获得比通过术语库所得的效率提升得更多的效率。

    于是乎,我就开始尝试在谷歌机器翻译的基础上进行编译。但是,那个时候几乎任何一款CAT软件都尚不支持直接引用谷歌机器翻译的内容。怎么办呢?我开始从这种双语文件身上打主意,尝试能不能让谷歌翻译来处理这种文件。
    最开始的思路,是把它上传到谷歌翻译工具包,用翻译工具包自动翻译。翻译完成的文件,原文列的内容已经变成了译文,把这一列的内容复制,重新粘贴到原始的、未经翻译的双语文件的译文列,这样就形成了原文和译文都有的双语文件。

    利用谷歌翻译RTF双语文件

    后来我又发现,如果使用谷歌的Chromo浏览器,可以直接将原文列复制粘贴到谷歌机器翻译页面,翻译完成之后复制译文,然后在双语文件当中选择对应的单元格并按粘贴快捷键——注意,这里需要严格对应,如我们选择的原文是从编号1到100的单元格,那么此时在粘贴之前也要选择对应目标语栏的1-100的单元格。然后按ctrl+V的粘贴快捷键,就能够把译文内容严丝合缝地粘贴进去。

    另外一点要注意的就是,谷歌的Chrome浏览器,或者Safari浏览器,和Word配合起来才能产生这样的粘贴效果。如果使用IE浏览器直接粘贴,就会使每一个单元格内都粘贴上全部的译文。经过研究发现,如果使用IE浏览器可以先借到纯文本的编辑器,把它粘贴到文本编辑器里,然后重新复制再回过来粘贴,就可以实现和Chrome浏览器中复制再回Word粘贴一样的效果了。相应的,大家如果使用的文件编辑器和文字处理软件不是Microsoft Word,而是其他的比如WPS或者OpenOffice,可能也会有不同的特性,需要摸索掌握其规律。

    不管怎样,通过这样的处理,我们就能够很顺利的把谷歌机器翻译结果粘贴到双语文件的译文区,粘贴保存完成后,把双语文件重新导入翻译项目,我们的翻译项目也就有了谷歌翻译的译文。

    这个实验成功之后,我把这个处理的方法告诉了山东交通学院外语系的李庆庆老师。李庆庆老师对于软件的应用和编程都有一些独到之处。他就说,他可以研究一下Deja Vu的项目文件格式,看看能不能直接调用谷歌的API。他成功了——他发现能够用外部程序直接打开Déjà Vu的项目翻译文件这个数据库,然后调用谷歌的机器翻译API,为这个数据库里的译文区直接采集灌入谷歌的机器翻译。他写的这款小程序非常的精巧,有了这款小应用,我只需要把整个的翻译项目拖放进去,它就能够自动填入谷歌翻译的结果。不经意间,我和李庆庆老师的探索,几乎就成了最早的把机器翻译融入到应用计算机辅助翻译的社科图书翻译实践中的案例。

    相关文章

      网友评论

        本文标题:闲话CAT(5):Déjà Vu——或许是最早的CAT支持下的M

        本文链接:https://www.haomeiwen.com/subject/gocsqxtx.html