HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

文档分类中的多特征最大值法及其改进方法

作者:龚静; 黄欣阳文档分类评估函数特征最大值f1测度特征数

摘要:为在每个文档类别中选择更多的特征,解决至少一个特征法(ALOF)的特征不足问题,提出文档特征最大值法(MFT)和改进的文档特征最大值法(IMFT)。按照数据处理方式决定选择特征的数量,MFT法解析所有文档,确保训练集中每个文档都用最终特征矢量来表示,IMFT法只分析特征评估函数中特征值高的文档以选择较少的特征,减少选择不相关特征的概率。实验考虑3个文档分类数据库和3个评估函数,实验结果表明,与ALOF法和模糊关联聚类(FRC)法相比,提出的两种方法的F1测度更高,分类效果更好,评估函数对最终的分类结果具有重要影响,不同的特征数会左右最终结果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与设计

《计算机工程与设计》(CN:11-1775/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情