作者:库波; 晁学鹏数据挖掘可扩展hadoop协同聚类用户行为
摘要:网站通常从用户中分析挖掘出其中隐含的规律,为其创造更多的价值。随着互联网的普及,互联网的用户成指数级增长给互联网传统的分析算法带来了极大地挑战。本文针对网站中存在的海量用户数据,设计了基于MapReduce分布式编程框架的协同聚类算法。该算法是分布式并行地统计聚类信息,更加高效地分析处理用户数据,完成网站中的用户行为分析工作。实验表明,本文提出的算法不仅具有很高的加速比,而且具有很好的可扩展性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社