利用N-gram和语义分析的维吾尔语文本相似性检测方法

作者：张莹; 亚森·艾则孜; 吴顺祥维吾尔语文本相似性检测潜在语义分析

摘要：为了实现维吾尔语文本的相似性检测,提出一种基于N-gram和语义分析的相似性检测方法。根据维吾尔语单词特征,采用了N-gram统计模型来获得词语,并根据词语在文本中的出现频率来构建词语-文本关系矩阵,并作为文本模型。采用了潜在语义分析(LSA)来获得词语及其文本之间的隐藏关联,以此解决维吾尔语词义模糊的问题,并获得准确的相似度。在包含重组和同义词替换的剽窃文本集上进行实验,结果表明该方法能够准确有效地检测出相似性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机应用研究

《计算机应用研究》（CN：51-1196/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机应用研究》杂志以其新颖性、学术性、系统性、技术性于一身，瞄准国家迫切需要的前沿技术，及时反映并涵盖了国内外计算机学科领域最新发展趋势及技术动向，注重刊登反映本学科领域的新理论、新方法、新技术，选题新颖，可读性强而备受广大读者所喜爱，在各行各业拥有大量的读者、作者，在计算机业界享有崇高的知名度和影响力。

杂志详情

服务推荐

计算机应用研究相关期刊

利用N-gram和语义分析的维吾尔语文本相似性检测方法

服务推荐

在线咨询

杂志订阅

期刊推荐

网友世界

计算机光盘软件与应用

计算机与网络

计算机仿真