基于电子政务主题词表的中文匹配方法

作者：杨芳电子政务主题词表中文匹配新词学习互信息值

摘要：讨论了基于电子政务主题词表的中文匹配方法.该方法以电子政务主题词表为基础,对中文文本进行匹配,找出文本中的主题词,作为进一步标引文本和检索文本的前提.为了匹配出文本中出现频率较高的而主题词表中没有的词语,我们根据n-Gram统计特性学习新词.对于匹配结果中出现的交集型歧义这类主要的歧义类型,通过计算匹配词语与其交集词语各自字符之间的互信息值,来消除匹配词语的交集歧义,互信息值较大的词说明该字符组合的可能性比较大.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

情报

《情报杂志》（CN：61-1167/G3）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《情报杂志》以情报学服务国家安全、服务政府及企业决策为宗旨，以情报学理论与情报工作实践，情报分析方法与技术、情报管理与服务、情报机构与情报人才等为培育方向，重点关注：情报研究、智库建设、舆情研究、信息分析、知识发现、情报服务、信息计量研究、文献计量研究、网络计量研究、信息资源管理等。

杂志详情

服务推荐

情报相关期刊

基于电子政务主题词表的中文匹配方法

服务推荐

在线咨询

杂志订阅

期刊推荐

科技情报开发与经济

图书情报导刊

轿车情报

情报科学