HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于串频统计的汉语和孟加拉语专有名萌识别

作者:柯修 王惠临 于薇专有名词识别串频统计nagao算法ssr算法

摘要:基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现基于串频统计的跨语言专有名词识别系统。实验表明,系统能够从输入的生语料中有效地识别出人名、地名、团体机构名等。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

现代图书情报技术

《现代图书情报技术》是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 重要通知:《现代图书情报技术》杂志已正式更名为《数据分析与知识发现》杂志。

杂志详情