作者:陈志强频繁模式关联规则数据挖掘
摘要:事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经提出了许多对事务数据库中频繁模式、关联规则的挖掘算法。根据挖掘的目标和应用的领域不同,这些挖掘方法大致可以分为两大类:以Apriori为代表的产生候选集算法和以Jiawei Han等人提出的FP -growth为代表的不产生候选集算法。由于候选项集的产生往往是非常耗时的,因而FP-growth算法的效率比Apriori算法提高了近一个数量级。本文在描述FP-growth算法的基础上,具体讨论了如何优化数据结构,有效的实现该算法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社