作者:季传灵kmp算法编辑距离算法模糊匹配simhash算法
摘要:针对外星语字母词根快速查找的问题,提出了外星语字母词根查找模型,该模型的具体方法是基于编辑距离模糊匹配和KMP算法的综合算法.首先利用统计学方法获得符合题意的30段文本,作为数据样本,并将第一段所有的数据映射为一个数组的数据结构且对其进行平移连续切词;然后再利用KMP算法和编辑距离算法将所切词与余下文本段进行模糊匹配;最后,考虑算法的时间复杂性和空间复杂性,对算法进行优化,使其在初步的基础上提高查找片段的速度和数量.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社