作者:杨凯; 赵明洲; 毛文瑞; 张瑛楠数据分析数据挖掘数据预处理缺失值异常值
摘要:数据作为现代企业的宝贵资源,占据着越来越重要的地位,它是科学管理的基础、正确决策的前提、有效调控的手段。本文介绍了数据预处理的主要方法,包括:数据清洗、数据集成、数据变换和数据归约。根据这些数据方法来对2015-2017年电网生产项目的原始数据进行处理。其中重点包括:缺失值的处理,异常值的处理,变量和变量值的变换,以及数据精简。最终为电网生产项目优化的分析建模和算法提供可靠性的数据支持。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社