作者:韩莹 王茂发 陈新房 潘志安 张艳霞中文信息处理中文分词词典机制2000进制拉链式词值哈希机制
摘要:汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.国内自80年代中后期就开展了中文分词词典机制的研究,为了提高现有基于词典的分词机制的查询效率,对于词长不超过4字的词提出了一种全新的分词词典机制——基于汉字串进制值的拉链式哈希机制即词值哈希机制.对每个汉字的机内码从新编码,利用进制原理,计算出一个词语的词值,建立一个拉链式词值哈希机制,从而提高查询匹配速度.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社