HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于信息熵的混合属性数据谱聚类算法

作者:姜智涵; 朱军; 周晓锋; 李帅混合属性数据谱聚类高斯核函数影响因子

摘要:针对传统的聚类算法只能处理单属性的数据,不能很好地处理混合属性数据的聚类问题,以及目前大多数混合属性数据聚类算法对初始化敏感,不能处理任意形状的数据的问题,提出一种基于信息熵的混合属性数据谱聚类算法,用于处理混合类型数据。提出了一种新的相似性度量方式,利用谱聚类算法中的数值型数据构成的高斯核函数矩阵与新的基于信息熵的分类型数据构成的影响因子矩阵相结合代替了传统的相似度矩阵,新的相似度矩阵避免了数值属性与分类属性数据之间的转换和参数调整;把新的相似度矩阵运用到谱聚类算法中,以便于处理任意形状的数据,最终得出聚类结果。通过在UCI的数据集上的实验表明,该算法能有效地处理混合属性数据的聚类问题,且具有较高的稳定性以及良好的鲁棒性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用研究

《计算机应用研究》(CN:51-1196/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机应用研究》杂志以其新颖性、学术性、系统性、技术性于一身,瞄准国家迫切需要的前沿技术,及时反映并涵盖了国内外计算机学科领域最新发展趋势及技术动向,注重刊登反映本学科领域的新理论、新方法、新技术,选题新颖,可读性强而备受广大读者所喜爱,在各行各业拥有大量的读者、作者,在计算机业界享有崇高的知名度和影响力。

杂志详情