作者:朱国荣; 冯昊; 叶玲节大数据高维数据自表示特征选择
摘要:在大数据时代,特征选择对于降低复杂度、压缩存储量、提升数据分析泛化能力等具有重要作用。针对大量的无标签高维样本,无监督特征选择技术能够更好地缓解维数灾难问题并得到了广泛应用。对此,提出了一种凹型正则约束的自表示模型,通过特征间的互线性表示以及l_(2,p)范数用于无监督特征选择。对比常见的凸函数约束,所提方法具有更为稀疏的系数解,能更有效地选择显著性特征子空间。为求解目标系数,进一步提出了一种有效的迭代重加权最小二乘算法,保证模型得以收敛至稳定解。9个公开数据集中的试验表明,所提方法在分类精度和聚类性能方面都优于其他对比算法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社