作者:彭焕峰lucene哈希整词二分最大匹配
摘要:针对Lucene自带中文分词器分词效果差的缺点,在分析现有分词词典机制的基础上,设计了基于全哈希整词二分算法的分词器,并集成到Lucene中,算法通过对整词进行哈希,减少词条匹配次数,提高分词效率。该分词器词典文件维护方便,可以根据不同应用的要求进行定制,从而提高了检索效率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《信息技术与网络安全》(CN:10-1543/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息技术与网络安全》现已更名为《网络安全与数据治理》。
部级期刊
人气 53070
人气 34233 评论 12
人气 8723 评论 14
省级期刊
人气 5645 评论 10