HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

汉语语料词性标注自动校对方法的研究

作者:钱揖丽; 郑家恒计算机应用中文信息处理兼类词汉语词性标注自动校对粗糙集

摘要:兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量.针对这一难点问题,本文提出了一种兼类词词性标注的自动校对方法.它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息,自动生成兼类词词性校对规则,并应用获取的规则实现对机器初始标注语料的自动校对,从而提高语料中兼类词的词性标注质量.分别对50万汉语语料做封闭测试和开放测试,结果显示,校对后语料的兼类词词性标注正确率分别可提高11.32%和5.97%.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中文信息学报

《中文信息学报》(CN:11-2325/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情