自纠正词对齐

作者：龚慧敏; 段湘煜; 张民自纠正词对齐粗颗粒度到细颗粒度

摘要：词对齐是统计机器翻译系统的重要一环，但词对齐的获得往往基于序列模型的计算，而没有考虑语言的结构化信息及语言特征，从而造成词对齐中出现一些不符合语言特征的结果。文中提出一种词对齐的自纠正机制，以纠正词对齐中的错误部分。该机制使用一些语言学上的先验知识，对词对齐结果进行由粗颗粒度到细颗粒度的纠正。首先采用基于标点的方法对句对进行粗粒度化纠正，然后采用基于统计特征的方法对子句对进行细粒度化纠正。该自纠正过程不需要借助任何其他词对齐工具和新语料。实验结果显示，自纠正词对齐显著提高了词对齐的准确率，并提高了机器翻译的质量，其中粗粒度的纠正方法对翻译质量的提高最为显著，细粒度的纠正方法也提升了翻译质量，最终通过结合粗颗粒度和细颗粒度的纠正方法，使翻译结果相对基准系统取得了显著的提高。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机科学

《计算机科学》（CN：50-1075/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机科学》报导国内外计算机科学与技术的发展动态，以其新颖、准确、及时为特色，突出动态性、综述性、学术性，“前沿学科”与“基础研究”相结合；“优秀技术”与“支撑技术”相结合；“倡导”与“争鸣”相结合。

杂志详情

服务推荐

计算机科学相关期刊

自纠正词对齐

服务推荐

在线咨询

杂志订阅

期刊推荐

科技风

魅力中国

科学与财富

科学中国人