HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

机器翻译自动评价中领域知识复述抽取研究

作者:张丽林; 李茂西; 肖文艳; 万剑怡; 王明文复述机器译文自动评价语言模型markov网络文档聚类

摘要:针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务的应用中容易出现复述匹配偏差的问题,提出采用抽取与测试领域相关的复述来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤,得到特定领域训练语料,然后在训练语料中利用Markov网络模型,抽取特定领域复述表,最后将此复述表应用在机器译文自动评价中,以提高同义词和近义词的匹配精度。在WMT’14 Metrics task和WMT’15 Metrics task数据集上的实验结果表明,利用领域知识抽取的复述能够增加自动评价方法METEOR和TER与人工评价的相关性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

北京大学学报·自然科学版

《北京大学学报·自然科学版》(CN:11-2442/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《北京大学学报·自然科学版》主要刊登基础科学、应用科学及交叉科学等领域的研究成果及综述性文章。由北京大学理工科的40名教授组成编委会,负责确立学报的办刊宗旨及审定论文的学术质量。

杂志详情