HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于HADOOP集群的数据采集和清洗

作者:刘晨; 焦合军海量数据hadoophive数据采集数据清洗

摘要:互联网的到来,使计算机行业蓬勃发展,各公司的业务数据也都到达P级别的数据量。本文结合Hadoop框架的中Hive和Hbase,对各个模块进行了详细的描述,重点分析了集群搭建步骤,及如何对集群的数据进行采集和清洗,并通过建立表来存储分析结果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

软件工程师

《软件工程师》是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 重要通知:《软件工程师》杂志已正式更名为《 软件工程》杂志。

杂志详情