HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于同义词发现的文本扩充算法

作者:李波 石慧霞同义词发现知网层次架构相关系数文本分类

摘要:文本分类算法在进行分类时存在待分类文本中关键词稀疏、难以充分表征文本特性的问题,导致文本分类的准确率不高。提出一种基于同义词发现的文本扩充算法,利用知网中义原间的层次架构,获取待分类文本中关键词的位置信息,并发现关键词路径中位于不同层次的同义词,利用知网义原之间层次性和密度差异为关键词和不同层次的同义词之间赋予相应的相关系数。将提出的文本扩充算法运用于文本分类,以20Newsgroups和Reuters21578Top10为测试数据集进行实验。实验结果表明:改进算法的文本分类准确率和F1值有了较大提高。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

重庆理工大学学报·自然科学

《重庆理工大学学报·自然科学》(CN:50-1205/T)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《重庆理工大学学报·自然科学》以政治哲学、工商管理、法学、语言文学为主要刊登内容,集学术性、知识性、实用性于一体,理论联系实际。

杂志详情