作者:周其林 雷菊阳 王昱栋 张兰兰算法理论聚类算法惩罚参数递增思想全局性
摘要:针对传统k-均值聚类算法的两大缺点,即算法中需要知道确定的聚类数和初始种群选取的随机性,提出了一种新的聚类算法,即基于k-均值聚类算法的无需确定聚类数的聚类算法.这种算法是基于递增思想的聚类算法,最大的特色是无需事先知道聚类数,初始聚类数取1,初始聚类中心为所有数据点的聚类中心,算法中首先设定一个惩罚参数,对于确定的惩罚参数,运算时聚类数逐渐增加,直到收敛,即聚类数不再发生变化,就得到了所需的聚类数以及最终的聚类结果.运用于茶叶分类和各省市平均工资水平分析的2个实验也验证了这种算法的可行性,通过实验可知,这种聚类算法具有较好的全局收敛能力和较高的正确率,稳定性强,收敛速度快.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社