作者:吐尔地·托合提; 维尼拉·木沙江; 艾斯卡尔...维吾尔文n元递增算法语义串抽取主题相似度文本分类
摘要:该文研究一种改进的n元递增算法来抽取维吾尔文本中表达关键信息的语义串,并用带权语义串集来刻画文本主题,提出了一种类似于Jaccard相似度的文本和类主题相似度度量方法,并实现了相应的维吾尔文分类算法。实验结果表明,该文提出的文本模型简单有效,分类算法计算量不高,而且还能达到或超过经典分类器的分类综合性能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《中文信息学报》(CN:11-2325/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
省级期刊
人气 649762 评论 60
部级期刊
人气 442379 评论 71
人气 237770 评论 36
人气 218385 评论 68