HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于非均衡数据集的新型混合重取样算法

作者:谷琼 王贤明 李文新非均衡数据集重取样机器学习分类

摘要:在分析重取样技术的基础上,设计并实现了自适应选择近邻的混合重取样算法。该方法结合过取样和欠取样方法的优势,改进了SMOTE过取样算法在产生合成样本过程中存在的盲目性及只能复制生成数值属性的问题,新算法能根据实例样本集内部分布的真实特性,自适应调整近邻选择策略,对不同属性的数据采取不同的复制方法生成新的少数类实例,控制和提高合成样本的质量;并通过对合成之后的数据集用改进的邻域清理方法进行适当程度欠取样,去掉多数类中的冗余实例和边界上的噪音数据,减少其规模,在一定程度上达到相对均衡,从而可有效地处理非均衡数据分类问题,提高分类器的性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉理工大学学报·信息与管理工程版

《武汉理工大学学报·信息与管理工程版》(CN:42-1825/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《武汉理工大学学报·信息与管理工程版》重点刊登电子与电工、通信与信息、计算机、控制与自动化以及经济、管理科学与工程、物流工程等学科的最新研究成果,同时刊登机械工程、土木工程与建筑、船舶与海洋工程以及力学、数学、物理学等基础学科的研究与工程应用论文。

杂志详情