作者:刘猛云计算数据挖掘k均值聚类总体运行时间
摘要:云计算可按软件即服务(Saa S)的形式提供数据挖掘的结果。数据挖掘的性能和质量是云计算环境下数据挖掘应用的重要使用标准。文中提出一种基于云计算的数据挖掘应用及其数据集的分布和调度框架,该框架实现了基于云计算的K均值聚类方法,并将其作为云软件即服务(Saa S)来提供给用户,其主要目标是降低应用的总体运行时间,将挖掘质量的损失最小化。仿真结果表明,相比于已有方案,其方案在速度获得显著提升的同时,挖掘质量损失最小。另外,当聚类数量和数据集的规模上升时,挖掘质量也具有良好的扩展性,可促进本文方案在云服务提供商中的应用。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社