HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于大数据的数据清洗研究

作者:康鲲鹏数据清洗方差分量大数据长程依赖多级模型时间序列

摘要:大数据具有体量大、来源和格式多样、增长速度快、价值密度低和处理难度大的特点,即使通过合理设计参数对某段数据进行点估计的结果可能相当令人满意,但通过应用标准统计程序对整个数据体进行精度估计得到的结果,却是差强人意,从而误导人们。目的旨在分析影响大数据清洗的主要因素有哪些,首先回顾了数据获取对时间序列的依赖性并构造了一个大数据模型,然后在列出数据估计时所用的一些属性后,给出了数据清洗时的回归分析,同时探讨回归系数估计的可能影响。最后给出了大数据处理中误差累积的通用表示方法,提出了与时间序列理论中短程和长程依赖之间的区别大致相同的问题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

江西科学

《江西科学》(CN:36-1093/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《江西科学》为江西省科学院主办的自然科学综合性学术刊物,立足江西,面向全国,主要介绍江西省的重大科研成果和阶段性科研总结,发表具有一定理论水平和实践价值的理、工、农、医及某些边缘学科的学术论文和有关江西省自然条件、自然资源的考察报告。

杂志详情