作者:谭龙; 秦琦冰带权频繁模式事务集合差分治策略带权支持度
摘要:为提高带权频繁模式挖掘过程中的时空效率,定义事务集合差(the difference of two Tidsets,dTidset)概念,在dTidset的基础上对于WIT-Tree存储结构进行改进和优化,提出一种基于WIdT-Tree的带权频繁模式挖掘算法。利用分治策略和dTidset相关性质对带权支持度进行计算,提高计算效率;利用WIdT-Tree存储带权模式,减少空间消耗。在真实数据集和人工模拟数据集上分别进行测试和比较,实验结果表明,该算法具有更高的时间、空间效率和更好的可扩展性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社