HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于临床数据集的缺失值处理方法比较

作者:李琳; 杨红梅; 杨日东; 胡珊; 张学良; 周...缺失值插补缺失率随机森林插补多重插补

摘要:目的:对于数据缺失的处理方法是基于数据集研究的重要组成部分,缺失数据不仅会增大统计分析的复杂性和难度,还会导致分析结果的偏倚。因此,需要提供有效的方法降低缺失数据对整体的影响。方法:基于医学临床数据集,针对不同数据类型,比较了KNN插补、随机森林插补、决策树插补、多重插补4种不同的插补方法在不同的缺失率下的插补效果,并采用均方根误差和错误率评价插补效果。结果:KNN插补和决策树插补对缺失率有较高要求,当缺失率≥50%时这两种方法不适用;多重插补和随机森林插补对不同的缺失率情况下的插补效果变化不明显。结论:各插补方法对不同缺失率和不同的数据类型的插补效果不同。在以上四种方法中,随机森林插补在本研究中表现出较好的插补效果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国数字医学

《中国数字医学》(CN:11-5550/R)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国数字医学》以反映国内外数字医学发展动态,推动我国医疗卫生信息化快速发展为宗旨,以报道数字医学动态进展,传播数字医学理论方法,探究数字医学发展趋势,解读数字医学技术难题,展示数字医学科研成果,传递数字医学市场信息为优秀,向各级医疗卫生机构、医学高等院校、医学科研单位、IT企业与厂商等搭建学术交流平台。

杂志详情