作者:张阳; 余正涛; 周珂统计机器翻译词汇化调序模型汉语越南语语言特性
摘要:针对越南语语言特性, 提出在词汇化调序模型中融合语言差异特性的汉语一越南语的统计机器翻译方法.该方法首先分析汉语与越南语语法不同, 提取越南语在定语位置、 状语位置及修饰词词语顺序上与汉语的差异, 然后形式化定义这些差异规则, 以对数线性模型的形式融入进词汇化调序模型中.在训练过程, 通过融合语言差异特性的词汇化调序模型对符合特性的规则进行权重调优, 从而在解码过程中指导候选翻译的选择.实验结果表明, 在词汇化模型里融合语言特性的汉语一越南语的层次短语机器翻译模型比基准系统提高了0.6 ~ 2.1 个BLUE值.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社