HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于抽样的谱聚类集成算法

作者:孟娜; 梁吉业; 庞天杰抽样谱聚类聚类集成相似性矩阵有效性指标

摘要:谱聚类是利用样本数据集的相似性矩阵中特征向量的性质对样本数据集进行聚类.而随着数据规模的增加,谱聚类算法所耗时间会因为大规模的特征分解而明显增大.采用抽样方法可以有效降低算法所耗时间,但是简单随机抽样子集之间关联性太弱,通常无法准确反映数据集的分布特征.基于此,设计了一种新的抽样策略,利用该方法进行多次抽样,生成多个既具有关联性又具有差异性的数据子集.在每个数据子集上分别利用NJW算法(由Ng A Y、Jordom M I和Weiss Y提出)进行谱聚类,并根据最近邻原则将聚类结果映射到全体数据集,生成若干基聚类,最后,将聚类结果集成,得到最终的聚类划分.实验证明,该方法与传统NJW算法以及简单抽样集成算法相比,算法的效率及有效性有了一定的提高.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京大学学报·自然科学

《南京大学学报·自然科学》(CN:32-1169/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京大学学报·自然科学》报道内容包括数学、天文、计算机科学、物理、信息物理、化学、生物、生物化学、地球科学、大地海洋学、大气科学、环境科学、医学等学科的基础研究和应用研究。

杂志详情