HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

Hadoop平台下基于快速搜索与密度峰值查找的聚类算法

作者:郭友雄; 黄添强; 林玲鹏; 黄维hadoop快速搜索与密度峰值查找聚类mapreduce

摘要:针对K-means并行化算法中需要人为初始化起始中心点以及每次迭代都要重复计算所有点与中心点距离的低效率问题提出了一种基于快速搜索与密度峰值查找的并行化算法.采用了"化整为一"原则对算法进行并行化处理,即将每个节点的Map阶段得到的局部CFSFDP聚类结果集中的每个簇视为一个待聚类样本点,在Reduce阶段将这些样本点再进行一次CFSFDP聚类,从而能够快速的将相似的簇聚集在一起归并为同类别.采用Hadoop平台下的并行编程方法,以海量的新闻信息聚类进行实验.实验结果显示,嵌入了基于快速搜索与密度峰值查找的聚类算法后,相对于传统的K-means并行化算法在效率与聚类的结果准确度上都有着明显的提升.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

福建师大福清分校学报

《福建师大福清分校学报》(双月刊)创刊于1981年,由福建省教育厅主管,福建师大福清分校主办,CN刊号为:35-1225/G4,自创刊以来,颇受业界和广大读者的关注和好评。 《福建师大福清分校学报》95年荣获福建省高等学校自然科学版系统优秀学报评比二等奖、95年荣获全国高等学校自然科学版系统优秀学报评比三等奖、99年荣获福建省优秀学报评比二等奖、2003年荣获首届《CAJ-CD规范》执行优秀期刊奖。 《福建师大福清分校学报》现已更名为《福建技术师范学院学报》。

杂志详情