HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

面向不平衡数据集的煤矿监测系统异常数据识别方法

作者:冀汶莉; 郗刘涛; 王斌煤矿安全监测异常数据识别不平衡数据集机器学习大数据下采样过采样随机森林

摘要:异常数据识别对于煤矿安全监测系统具有重要作用,但安全监测系统中异常数据一般只占数据总量的1%左右,不平衡性是此类数据的固有特点。目前多数机器学习算法在不平衡数据集上的分类预测准确率和灵敏度都相对较差。为了能准确识别异常数据,以煤矿分布式光纤竖井变形监测系统采集的数据为研究对象,提出了一种面向不平衡数据集、基于去重复下采样(RDU)、合成少数类过采样技术(SMOTE)和随机森林(RF)分类算法的煤矿监测系统异常数据识别方法。该方法利用RDU算法对多数类数据进行下采样,去除重复样本;利用SMOTE算法对少数类异常数据进行过采样,通过合成新的异常数据来改善数据集的不平衡性;并利用优化后的数据集训练RF分类算法,得到异常数据识别模型。在6个真实数据集上的对比实验结果表明,该方法的异常数据识别准确率平均值达到99.3%,具有较好的泛化性和较强的鲁棒性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

工矿自动化

《工矿自动化》(CN:32-1627/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《工矿自动化》杂志发行范围:煤炭行业的生产企业、装备生产企业、科研设计院所、大中专院校等,读者对象为煤炭行业相关技术领域的设计研究人员、工程技术人员、管理人员及大中专院校师生。

杂志详情