作者:张贤坤 李亚南 田雪中文分词词典机制尾字词典哈希结构逆向最大匹配算法
摘要:为提高逆向最大匹配分词算法的速率,分析传统的整词二分词典机制,针对哈希结构尾字词典的不足,提出一种基于双哈希结构的整词二分词典机制,并改进对应的逆向最大匹配算法。利用记录词长的尾字词典机制,使用双哈希结构保存词条,降低词典的词条匹配时间复杂度。实验结果表明,该词典机制将逆向最大匹配算法的分词速率提高近一倍。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机工程与设计》(CN:11-1775/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
北大期刊、统计源期刊
人气 542463 评论 58
部级期刊
人气 230508 评论 65
人气 229205 评论 63
人气 215385 评论 35