HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于EMM中文抽词算法的XMARC主题信息挖掘

作者:王兰成自动标引挖掘证明区间检索中文分词词典算法最大匹配性能

摘要:本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为"词首+长词匹配+短词推进"自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间.最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报学报

《情报学报》(CN:11-2257/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情