HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于电子政务主题词表的中文匹配方法

作者:杨芳电子政务主题词表中文匹配新词学习互信息值

摘要:讨论了基于电子政务主题词表的中文匹配方法.该方法以电子政务主题词表为基础,对中文文本进行匹配,找出文本中的主题词,作为进一步标引文本和检索文本的前提.为了匹配出文本中出现频率较高的而主题词表中没有的词语,我们根据n-Gram统计特性学习新词.对于匹配结果中出现的交集型歧义这类主要的歧义类型,通过计算匹配词语与其交集词语各自字符之间的互信息值,来消除匹配词语的交集歧义,互信息值较大的词说明该字符组合的可能性比较大.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报

《情报杂志》(CN:61-1167/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《情报杂志》以情报学服务国家安全、服务政府及企业决策为宗旨,以情报学理论与情报工作实践,情报分析方法与技术、情报管理与服务、情报机构与情报人才等为培育方向,重点关注:情报研究、智库建设、舆情研究、信息分析、知识发现、情报服务、信息计量研究、文献计量研究、网络计量研究、信息资源管理等。

杂志详情