作者:李彤社交网络数据处理spark分布式框架
摘要:在进行社交网络分析研究时,通常需要对海量社交关系数据进行清洗、处理和分析,传统的单机环境不能高效地用于解决该类问题。通过使用分布式计算框架Spark来处理该类问题,可以构建社交网络并计算社交网络结构,如连通性分析、网络度分析和平均路径长度等。利用Scala语言使用Spark中的RDD编程,完成对社交网络数据的处理。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《现代计算机》(CN:44-1415/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《现代计算机》是一本学科性、技术性较强的科技类学术期刊,作者读者群均面向计算机信息技术及应用研究开发设计生产的工程技术人员、大专院校师生及计算机爱好者。
部级期刊
人气 1074695 评论 53
省级期刊
人气 846141 评论 70
人气 807686 评论 68
人气 753457 评论 72