作者:倪巍伟; 孙志挥; 陆介平k邻域半径双参考数据点参考半径高维空间
摘要:聚类是数据挖掘领域的一项重要课题,高维空间聚类以数据分布稀疏、噪声数据多、"差距趋零现象"而成为难点.在分析现有聚类算法不足的基础上,引入k邻域点集、k邻域半径等概念,提出一种高维空间单参数k邻域局部密度聚类算法k-PCLDHD;为了提高算法的效率,进一步定义了参考距离等概念,并采用"双参考数据点"对数据集中的数据对象进行预处理,以减少扫描数据集的开销,提出k-PCLDHD的优化算法k-LDCHD.理论分析和实验结果表明,算法可以有效解决高维空间聚类问题,算法是有效可行的.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社