HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于编辑距离和相似度改进的汉字字符串匹配

作者:邵清; 叶琨编辑距离相似度归一化中文字符串近似匹配

摘要:为解决中文字符串匹配精度较低的问题,提出了一种基于编辑距离和相似度改进的汉字字符串近似匹配算法,针对汉字字符串特点,使用汉字拼音和五笔编码计算;通过改进动态规划算法,能够有效提高编辑距离的计算准确度以及执行效率;再引入考虑交换问题的归一化算法,以语义编辑距离与长句长度的比值作为归一化结果,以此来提高近似匹配算法的准确度。实验结果表明,改进后算法计算的相似度质量要优于改进前的算法结果,且对提高算法效率和查全率、查准率和时间性能等指标均有明显改善,证明该算法的可行性和有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子科技

《电子科技》(CN:61-1291/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《电子科技》主要刊登电子科学技术领域中的新发明、新技术、新设计、新工艺、新材料、新产品以及实用技术方面的技术论文、综述等稿件。

杂志详情