HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于Spark平台的FP-Growth算法优化与实现

作者:黄婕spark关联规则频繁项集

摘要:针对FP-Growth算法面对海量数据挖掘时串行操作机制出现内存瓶颈或者数据挖掘失效等问题,提出将基于Spark平台的FP-Growth算法在数据分组策略和项头表结构两方面进行优化。一方面提出一种S型的负载权值均衡分组的方式;另一方面,设计出一种新的项头表结构,此结构包含Hash查找表,能有效降低查找时间复杂度。实验证明,优化的基于Spark平台的FP-Growth算法(OptFP-Spark算法)具有更高的并行运算加速比、更好的并行挖掘效果及更高效的计算效率。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

湖南工业大学学报

《湖南工业大学学报》(CN:43-1468/T)是一本有较高学术价值的双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《湖南工业大学学报》为学术类期刊。关注学科研究前沿,及时报道基础研究和技术开发成果,为党校科研教学服务,为推进国家和地方工业产业升级的进程作贡献;中国学术期刊综合评价数据库来源期刊。

杂志详情