作者:李荣富分布式处理集群服务器相关产品大数据集编程模型emr亚马逊软件库
摘要:Hadoop是如今大数据革命的代表性技术,做Hadoop相关产品有很多,其中有很多不一样的选择和变种,比较知名的有Cloudera、Hortonwork、亚马逊EMR、Storm和Spark。这些都是Hadoop的忠实“粉丝”。想要搞清楚大数据和Hadoop的关系,我们还得先认识一下Hadoop。如何理解Hadoop呢?官方给的定义是这样的:作为一种软件库,Hadoop允许在集群服务器上使用简单的编程模型对大数据集进行分布式处理。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社