作者:李玉鑑 周兰珍 操卫平文档频率chi统计联合特征选取网页分类
摘要:分析了与类别信息有关的CHI统计特征选取方法和与类别无关的文档频率特征选取方法,在此基础上提出文档频率与CHI统计相结合的特征提取方法,以选取分类能力强的词项特征,从而提高网页分类效果.以该联合特征提取方法为基础构建的网页分类系统,在参加SEWM2007分类评测的8个代表队中,取得Macro-F1值排名第3的成绩.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《北京工业大学学报》(CN:11-2286/T)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
省级期刊
人气 366844 评论 69
人气 239239 评论 36
人气 202991 评论 53
人气 154589 评论 33