作者:吴宏林; 吕学强; 任飞亮; 赵英科; 姚天顺自然语言处理双语语料库词对齐
摘要:提出了一种基于句子级对齐的双语语料库的英汉词对齐方法.它建立在句对的集合表示形式的基础上,通过最小求交模型实现词对齐.使用倒排索引表和集合运算实现高效的最小求交算法.在对齐过程中引入高频干扰词表以提高召回率.实验结果表明,该方法优于使用共现互信息的词对齐和使用双语词典的词对齐方法.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《小型微型计算机系统》(CN:21-1106/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《小型微型计算机系统》杂志刊登文章的内容涵盖计算技术的各个领域(计算数学除外)。包括计算机科学理论、体系结构、计算机软件、数据库、网络与通讯、人工智能、多媒体、计算机图形与图像、算法理论研究等各方面的学术论文。
部级期刊
人气 230277 评论 65
人气 214965 评论 35
省级期刊
人气 213216 评论 71
北大期刊、统计源期刊
人气 193068 评论 73