作者:吐尔地·托合提; 维尼拉·木沙江; 艾斯卡尔...维吾尔文语义串抽取特征评价及选取向量空间模型
摘要:该文研究一种改进的n元递增算法来抽取文本中表达关键信息的语义串,然后用多特征融合的评价方法为每一个文本选取最重要的语义串,并用这些语义串作为特征表示文本。通过K_means聚类分析的实验结果表明,以语义串作为特征可以构造比单词特征集更紧凑的文本模型,不仅可以大大降低特征空间的维度,对于提高聚类算法性能也是非常有效的。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《中文信息学报》(CN:11-2325/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
省级期刊
人气 651444 评论 60
部级期刊
人气 443392 评论 71
人气 238529 评论 36
人气 219957 评论 68