HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

利用类-项权重和类-项密度的文本分类方法

作者:袁乖宁; 冯永文本分类度量分类器

摘要:为获得更加准确的文本分类结果,讨论分类器对文本分类的影响,提出一种基于类-项权重和类-项密度的文本分类方法,使用SVM和k-NN分类器进行研究。类-项权重是指包含项的文件总量与包含项的类文件总量的比率,类-项密度是指兴趣类中项发生数量与整个语料库中项发生数量的比率,将这两个特征作为文本分类的度量方法。将标记的文件归类到已知类中,使用提出的度量方法预测所给对象的相关程度,使用分类器进行分类。对20个新闻组的数据集进行实验,实验结果表明,相比于其它同类方法,该方法拥有更高的分类精度,查全率和F测度表现优异,具有潜在的应用价值。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与设计

《计算机工程与设计》(CN:11-1775/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情