作者:杨沛; 郑启伦; 彭宏; 李颖基挖掘算法可扩展投影xml文档web挖掘算法效率数据库点集对数搜索空间
摘要:频繁子树在Web挖掘、XML文档分析、生物信息处理等领域有着重要的应用.提出了一种新的基于投影的频繁子树挖掘算法(PFTM),通过对数据库和候选节点集进行投影,并采用递推式候选节点集更新技术来有效地压缩搜索空间,以高效地从森林中挖掘出频繁子树.PFTM不需要产生候选子树.性能对比实验表明,PFTM是有效和可扩展的,而在算法效率上,PFTM要比FREQT平均高出40%左右.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社