HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种改进的特征选择方法在文本分类系统中的应用

作者:李长虹; 李堂秋文本分类特征选择文档频数互信息量

摘要:本文在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型。该模型首先对文本进行分析,把文本表示成向量空间的形式。文本在经过预处理后,按一定规则提取关键词,关键词的提取中增加了对名词短语的识别。特征选择的方法上,结合了文档频数和互信息量,并对他们进行了改进。实验结果表明,使用新方法进行分类所得到的分类精度得到了一定的提高。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术问题研究

《学术问题研究》是一本有较高学术价值的大型半年刊,以“创新、求索”为指导思想,以繁荣学术研究,推动学校科研水平的不断提高和可持续发展为宗旨,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。

杂志详情