作者:舒远仲; 戴海辉; 吴小玲大数据mapreduce数据挖掘
摘要:Fp-Growth算法是频繁模式挖掘的经典算法,已在许多领域得到了良好应用。传统Fp-Growth算法是基于内存的,而计算机内存却无法装载入大数据,故传统Fp-Growth算法并不能有效地处理大数据。提出一种新的基于MapReduce并行计算框架的Fp-Growth实现,使Fp-Growth算法在多台计算机上并行计算,从而实现大数据的有效处理。实验结果表明,该算法具有很好的扩展性,频繁模式挖掘效率随着用于计算的主机的增加而平稳提升。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社