作者:蔡丛豫数据挖掘算法粗糙集理论数据挖掘技术知识约简算法离散化算法数据离散化属性重要性并行算法
摘要:引言:就传统的数据挖掘技术来说,其在数据量级方面存在着一定的局限性,影响最终的效果,所以将粗糙集理论应用其中。对此,本文以算法的优化为切入点,对一种基于粗糙集的海量数据挖掘算法进行分析。结合本文的分析,其目的就是优化海量数据挖掘算法,并以全新的并行算法等为基础,提高海量数据挖掘的效率,以期为相关人员提供参考。1.基于粗糙集对Rough Set知识约简算法的改进1.1离散化算法在Rough Set知识获取方法中,数据离散化是其关键的构成内容之一,本文就采用属性重要性的方式,将CDL引入到原算法之中,保证这种算法能够实现对海量数据的挖掘。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社