作者:刘晨; 焦合军海量数据hadoophive数据采集数据清洗
摘要:互联网的到来,使计算机行业蓬勃发展,各公司的业务数据也都到达P级别的数据量。本文结合Hadoop框架的中Hive和Hbase,对各个模块进行了详细的描述,重点分析了集群搭建步骤,及如何对集群的数据进行采集和清洗,并通过建立表来存储分析结果。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《软件工程师》是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 重要通知:《软件工程师》杂志已正式更名为《 软件工程》杂志。
部级期刊
人气 211869 评论 35
省级期刊
人气 157550 评论 73
北大期刊、统计源期刊
人气 126758 评论 48
人气 118971 评论 52