HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于DOM树的XML数据频繁模式挖掘算法

作者:吉根林; 韦素云; 鲍培明xmldom树频繁模式增量式挖掘数据挖掘

摘要:由于XML数据具有半结构化特性,使得面向XML数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XML数据频繁模式挖掘算法,提出面向XML数据的频繁模式增量式挖掘算法FreqtTree。该算法首先将XML数据转化戍DOM树,然后从DOM树挖掘所有频繁模式。FreqtTree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。FreqtTree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算法只对DOM树遍历一次,具有较高的效率。采用多组数据对此算法的性能进行检验,并与其他算法作对比实验,实验结果表明该算法高效可行.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京航空航天大学学报

《南京航空航天大学学报》(CN:32-1429/V)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京航空航天大学学报》开设哲学、政治、经济、管理、法律、社会、航空、航天、民航、语言、文学、艺术、教育、心理等栏目,刊载相关领域的研究论文、调查报告等,着力推介原创性理论成果与实践成果,竭诚欢迎广大学者投稿。

杂志详情