作者:王贝贝; 杨明; 燕慧超; 孙笑仙应用数学相似矩阵谱聚类密度测地距离
摘要:为了消除在构建谱聚类算法的相似矩阵时,高斯核函数中尺度参数的波动影响,构建了一种自适应相似矩阵,并应用到谱聚类算法中。自适应相似矩阵中数据点间的距离度量采用测地距离算法,相距较近的两点间的距离近似于欧氏距离,相距较远的两点则先根据欧氏距离得到每个数据点的k个近邻点,然后累加近邻点的测地距离,由此得到每对数据点间的最短距离。两点间的局部密度用共享近邻的定义来表示,更好地刻画了数据集的本征结构。在5个人工数据集和国际通用UCI数据库中的5个真实数据集上进行实验。实验结果表明,所提算法的聚类准确率高于对比算法的准确率,对复杂分布数据有很强的自适应能力。研究成果为数据挖掘及机器学习提供了思路和方法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社