作者:周兵; 沈钧毅; 彭勤科数据挖掘并行聚类集群通信数据并行
摘要:探讨在集群环境下,如何设计并行聚类算法.作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈.所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想.从理论上,对采用数据并行思想后,影响聚类算法的加速比和聚类质量的因素进行了分析,然后通过一个验证算法PCIT(Parallel clustering algorithm based onIndex Tree)证实了理论分析的正确性.研究结果可以为以后设计更好的数据并行聚类算法提供理论依据.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社