HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题

作者:陈丽江分词竞赛已知词未登录词平衡性适应性

摘要:中文分词一直是大规模语料库加工的基础,它需要能够正确识别出语料中的已知词和未登录词,而各种基于规则和统计的方法在识别已知词和未登录词时各有优劣.本文试分别从已知词和未登录词识别两个方面,对ACL-SIGHAN第一届国际中文分词竞赛中各参赛系统进行比较,指出中文分词既需要提高已知词识别的准确率,还要能够较好地预测语料中出现的未登录词,并处理好它们之间的平衡关系.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京师范大学文学院学报

《南京师范大学文学院学报》(CN:32-1551/I)是一本有较高学术价值的大型季刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《南京师范大学文学院学报》将大力推出科学性、独创性、实践性相统一,具有新见解,新发现、新视角、新方法、新文风的学术论文;将从现实的文艺实践和学术活动中发现新课题,组织热点专题研究,从学术理论层面上作出探索与应答。

杂志详情