author:明天依旧可好
email:mtyjkh@outlook.com
time:2018-11
论文一
把英汉人名音译问题转换为以音节为基本单位的翻译问题,将连续的音节组合看作短语,引入一种基于短语的统计机器翻译方法,实现英汉人名的音译。首先,针对现有(1)音节划分方法存在的问题,提出一种改进的音节划分方法;其次,该文提出去除低频词法及基于C-value方法对(2)短语表进行优化,解决了训练语料偏小导致短语表中出现杂质信息的问题;之后,融入了汉语人名中首字(词)及尾字(词)的(3)位置特征,改善了生成的音译候选中汉字选取的不合理性;最后,提出了(4)两阶段音节划分方法,缓解了音节划分粒度过大导致的音译错误。
英汉音译主要分四个步骤:
- 音节划分
- 优化短语表
- 融入位置特征
- 实现两阶段音节划分
1. 音节划分
对于汉语语料,用空格将人名中的每个汉字隔开,将每个汉字看作句子中的一个词;对于 英文语料,则根据发音规则对语料进行音节划分,将每个音节看作一个词。
(1)将a、e、i、o、u定义为元音,m、n为鼻音,其他字母为辅音;
(2)若y跟着辅音出现,则y为元音,否则为辅音;
(3)按照英文发音的规律,制定了适合英汉人名音译的音节划分处理规则。
2. 优化短语表
C-value的短语表优化方法
参考文献:
[1]王丹丹,黄德根,高扬.基于音节划分及短语表优化的英汉人名音译研究[J].中文信息学报,2016,30(03):96-102.
论文二
基于音节的中英名称最大匹配音译法则,因具 备两大特色而值得大力推广和广泛学习使用: 第一为音译的相似度大大提高。音节构成音译的基本单 位,名称在目标语言译文中的发音音位最好和源语 名称的音位相似,而两种语言的音位结构差异在音 译过程中需要做出让步,不相容的音韵结构可能增 加额外的音节,由此便带来两种语言音译匹配度不 高的问题。使用该法则极大规避了两种语言音位结 构的差异,从而使得源语和目标语的音译达到最高 的融合度。第二为中英名称音译更具通用性和创新 性。本研究提出的音节双向最大匹配法,解决了用 同一语块对不同名称中的相同部分进行音译的 难题。
将音韵学中的起始音首要原则用于拆分英文名 称的音节,再将各音节与中文名称对齐匹配,得到 包含不同长度的对齐音节的双语词库,其意义在于
可以对以音节为基本单位的源名称进行分割产生的 词库进行最大化匹配,实现中英音译中的 “信达 雅”。
参考文献:
[1]蓝杨.基于音节双向最大化匹配的英汉名称音译[J].西南科技大学学报(哲学社会科学版),2017,34(06):31-36.
网友评论