作者:易未; 毛力; 孙俊; 吴林海不平衡数据集smote算法improvedsmote算法簇心
摘要:在不平衡数据集中,过抽样算法如Smote(SyntheticMinorityOversampling)算法、R-Smote算法与SD-ISmote算法可能会模糊多数类与少数类的边界以及使用噪声数据合成新样本。本文提出的ImprovedSmote算法使用少数数据集的簇心与其对应类别的少数集数据,在簇心与不大于样本属性数的对应类别少数集数据形成的图形内随机插值来生成新数据。ImprovedSmote算法结合C4.5决策树与神经网络算法在实验数据集上的结果比Smote,R-Smote与SD-ISmote算法更好,可以有效地提高分类器分类性能。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社