HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于大数据的数据挖掘引擎研究

作者:王小燕; 张丽敏大数据数据挖掘spark引擎

摘要:为了解决数据挖掘在大数据中存在的问题,文中对大数据下的数据挖掘引擎进行了研究,以Spark作为核心引擎,并在Spark的内存计算算子的基础上,实现了多个传统数据挖掘算法的并行计算,使得传统的数据挖掘算法能在集群环境中并行运行,从而在大数据中得到较好的应用.然后通过系统分层方法,将数据挖掘系统进行分层设计,实现了一个完整的大数据挖掘平台.实验表明,基于Spark实现的Apriori算法跟PageRank算法的并行计算能有效减少执行时间,在大数据挖掘上具有较好的应用.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子设计工程

《电子设计工程》(CN:61-1477/TN)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《电子设计工程》是经国家新闻出版总署、国际科技部批准的电子应用类期刊,多次评为陕西省优秀期刊。以其创新性、实用性、前瞻性,努力提升自身学术水平,是目前国内介绍电子应用技术的主要期刊之一,是国家正式刊物。

杂志详情