HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于Spark的并行化高效用项集挖掘算法

作者:何登平; 何宗浩; 李培强数据挖掘高效用项集spark大数据框架并行化

摘要:针对传统基于链表结构的Top-K高效用挖掘算法在大数据环境下不能满足挖掘需求的问题,提出一种基于Spark的并行化高效用项集挖掘算法(STKO)。首先从阈值提升、搜索空间缩小等方面对TKO算法进行改进;然后选择Spark平台,改变原有数据存储结构,利用广播变量优化迭代过程,在避免大量重新计算的同时使用负载均衡思想实现Top-K高效用项集的并行挖掘。实验结果表明,该并行算法能有效地挖掘出大数据集中的高效用项集。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程与科学

《计算机工程与科学》(CN:43-1258/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机工程与科学》的办刊宗旨是为计算机界同行发表有创见的学术论文,介绍有特色的科研成果,探讨有新意的学术观点提供理想园地;活跃计算机界学术气氛,扩大国内外交流,为发展中国的计算机事业尽一点微薄之力。本刊强调学术性、及时性和普及性。

杂志详情