HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于Monte Carlo模拟的四种完全随机双变量缺失数据处理方法的比较

作者:朱高培; 朱乐乐; 孟马承; 吴学森缺失值相关变量多重填补法montecarlo模拟

摘要:目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用MonteCarlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。结果当缺失比例为10%时,4种方法处理效果一致。随着缺失比例增加,4种方法处理后均值变化不大;均值填补法处理后相关系数小于其他方法,多重填补法和标准一致,回归填补法填补后相关系数比其他方法偏高而且呈增加趋势。随着回归系数的增加,回归填补法的相关系数准确性增加。结论4种方法处理完全随机缺失机制下两个相关变量的效果不同,当缺失比例较低时,建议采用成组删除法或回归填补法。当缺失比例较大时,建议使用多重填补法。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国卫生统计

《中国卫生统计》(CN:21-1153/R)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国卫生统计》是中国卫生统计学会的会刊,主要读者对象为各级卫生机构的卫生统计人员、卫生技术人员和高等医学院校卫生统计专业的教学和科研人员。

杂志详情