作者:肖文; 胡娟大数据稀疏数据频繁项集挖掘性能分析综述
摘要:频繁项集挖掘FIM是最重要的数据挖掘任务之一,被挖掘数据集的特征对FIM算法的性能有着显著影响。在大数据时代,稀疏是大数据的典型特征之一,对传统FIM算法的性能带来严峻挑战。针对在稀疏数据中如何高效进行FIM的问题,从稀疏数据的特征出发,分析了稀疏数据对3种类型FIM算法性能的主要影响,对已经提出的稀疏数据FIM算法进行了综述,对算法中采用的优化策略进行了讨论,最后通过实验对代表性的稀疏数据FIM算法进行了性能分析。实验结果表明,采用伪构造策略的模式增长算法最适合用于稀疏数据的FIM,在运算时间和存储空间上,相比其他算法该算法具有较大的优势。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
声明:本站持《出版物经营许可证》从事杂志订阅服务,不涉及出版事务,特此申明 工信部备案:蜀ICP备09010985号-13 公安部备案:51092202000203