HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于 Hadoop 的图书信息处理与分析

作者:吴萨mapreducehadoop分布式计算数据处理与分析

摘要:MapReduce算法是一种适用于分布式计算模型中的基于键-值对的一种算法。其根本思想是将一个大数据集(通常是T5级)分为小的模块分别进行并行计算,最后通过整合规约,得出结果。Hadoop是一个支持MapReduce算法思想的分布式框架,它提供方便的API接口使开发人员能够快速进行分布式程序的开发,而无需关心底层细节。基于在本课程中对MapReduce算法的学习与探究,本文中我们主要介绍了MapReduce算法以及Hadoop的基本架构,构建Hadoop伪分布式平台,并在此基础上设计算法处理并分析了一个图书信息数据集。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息周刊

《信息周刊》是一本有较高学术价值的周刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《信息周刊》已经形成了平面、网络、研究和市场活动的四维媒体平台,为中国商业科技决策者们提供一站式内容服务。

杂志详情