HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

面向不平衡数据集分类模型的优化研究

作者:温雪岩; 陈家男; 景维鹏; 徐克生文本分类不均衡数据集数据挖掘样本重采样熵值法

摘要:为提高不平衡数据集的分类效率,建立一种分类模型,从样本采样和分类算法两方面进行优化。对决策边界的少类样本进行循环过采样生成新样本集,并与决策边界外合成的少类样本集合并,提高样本的重要度。针对传统e-支持向量机U-SVM)在对不平衡数据集分类时超平面偏移的问题,引人正负惩罚系数和混合核函数,并利用客观的熵值法选取惩罚系数,提高分类算法的性能。实验结果表明,与标准的SVM算法相比,该分类模型在不平衡数据集分类上F-measure值平均提高18.1%,具有较好的分类效果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

《计算机工程》(CN:31-1289/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机工程》特点:以最快的速度、科学求实的精神,精选刊登代表计算机行业前沿科研、技术、工程方面的高、精、尖优秀论文。

杂志详情