作者:金之榆; 王毛毛; 史会磊负荷聚类dbscan聚类算法噪声点聚类评价指标
摘要:对于当前大规模和高维度的用户数据,原始聚类算法有其局限性。提出一种改进的K-means算法与数据降噪处理相结合的方法。首先,DBSCAN(基于密度的空间聚类算法)用于数据去噪,克服了原始K-means聚类算法聚类结果容易受到数据集中噪声点的影响。然后利用轮廓系数和误差平方和确定最优的聚类数。最后,将K-means++聚类算法和确定的最优聚类数用于聚类处理用户负荷曲线。这使得聚类算法避免陷入局部最优,通过数据集测试,表明该方法获得的聚类效果优于原始的K-means算法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社