作者:俞益; 陈以; 张忠林数据挖掘关联规则apriori算法分组并行
摘要:通过对 Apriori 算法基本原理和性能的研究分析,针对算法存在的不足,提出了一种更高效的基于对频繁项集分组并行的挖掘算法。该算法把频繁 k-1项集按照一定规律分组,每组频繁 k-1子项集直接产生频繁 k 子项集;再把每组产生的频繁 k 子项集合起来,这样每组不仅在自连接时减少了很多判断连接尝试,而且可以并行处理连接、剪枝行为,减少了等待时间,提高了查找频繁项集的速度。经过实验证实,改进后的算法在性能上有很大的提升。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社