作者:石杨青; 徐旭(指导)数据挖掘大数据分析flumeapachekafkastormredis
摘要:随着大数据时代的到来,能够留住老客户、吸引新客户、了解用户的兴趣爱好以及挖掘用户的潜在价值,这些对于运营商的发展至关重要,所以,对用户使用信息行为的统计价值非常大。移动互联网飞速的发展,网上信息资源数不胜数,每天要处理的日志文件信息巨大,而当今日志数据更是杂乱无章,各种日志文件没有标准化,这就导致数据挖掘的难度日益递增,如果还是采用高端硬件来处理数据,成本开销是非常大的,借助分布式计算来处理海量数据,可以有效解决这一弊端。本文就Hadooop构建PB级大数据平台下实现的一个实例进行简述,strom统计wordcount。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社