作者:柯修 王惠临 于薇专有名词识别串频统计nagao算法ssr算法
摘要:基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现基于串频统计的跨语言专有名词识别系统。实验表明,系统能够从输入的生语料中有效地识别出人名、地名、团体机构名等。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《现代图书情报技术》是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 重要通知:《现代图书情报技术》杂志已正式更名为《数据分析与知识发现》杂志。
省级期刊
人气 279799 评论 74
人气 43343 评论 12
CSSCI南大期刊
人气 35973 评论 48
人气 28360 评论 10