作者:谢霖铨; 赵楠; 徐浩; 毕永朋knn填补主成分分析协方差离差属性影响量
摘要:为了进一步提高缺失数据的填补效果和降低数据缺失比例带来的影响,提出了基于属性相关的KNN近邻填补算法.将主成份分析算法应用到KNN填补算法中,先用KNN算法计算得到的数值作为主体填补值,然后使用主成分分析过程中产生的协方差矩阵作为整体属性的相关性.由缺失项和K个近邻的离差和相应相关性算出属性影响量,最后并入到KNN计算值之中,得到的数值就是算法改进后的最终估算数值.经数据集仿真实验,算法改进后填补效果更好准确度更高.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社