HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于MapReduce模型可扩展的序列模式挖掘的研究

作者:朱林序列模式挖掘大数据云计算mapreduce框架

摘要:序列模式挖掘是数据挖掘领域的研究课题之一,针对传统算法对处理大数据普遍存在扩展性问题。为了改进扩展性,本文提出云模式下基于MapReduce的序列模式挖掘算法(SPAMC),本文设计出迭代MapReduce框架来高效生成候选模式,并在构建词法序列树时进行修剪。该框架不仅将树结构的子任务分给并行排列的独立映射机,而且能实现对支持计数的并行处理。选用32台虚拟机构建云环境,对多达1300万个交易序列进行了全面实验,实验结果表明SPAMC可大大缩短大数据的挖掘时间,达到极高的可扩展性,并提供云聚集的理想负载平衡。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

科技通报

《科技通报》(CN:33-1079/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《科技通报》多次评为“浙江省优秀期刊”、“华东地区优秀期刊”,是《中国科技论文统计源期刊》、《中国科学引文数据库来源期刊》,中国科技优秀期刊。2000年后先后被《中文优秀期刊要目总览》、《中国优秀期刊(遴选)数据库》、《中国学术期刊文摘》、《中国生物学文摘》、《中国生学文献数据库》等收录。获奖情况:浙江省优秀科技期刊一等奖。

杂志详情