HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于粗糙集加权的文本分类方法研究

作者:胡清华; 谢宗霞; 于达仁文本分类变精度粗糙集模型分类器文本自动分类智能信息处理支持向量机特征词加权方法研究课题基本特点

摘要:文本自动分类是当前智能信息处理中一类重要的研究课题.本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式.这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性.最后利用支持向量机和K近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报学报

《情报学报》(CN:11-2257/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情