作者:刘匆提; 李昂; 门志红; 姜博; 肖纯; 刘艳...惩罚logistic回归l1正则化l2正则化弹性网正确指数
摘要:目的比较L1正则化、L2正则化和弹性网三种惩罚logistic回归对SNPs数据的变量筛选能力。方法根据所设置的参数生成不同条件的SNPs仿真数据,利用正确率、错误率和正确指数从三个方面评价三种惩罚logistic回归的变量筛选能力。结果正确率表现为IJ2正则化惩罚logistic回归〉弹性网惩罚logistic回归〉L1正则化惩罚logistic回归;错误率表现为L2正则化惩罚logistic回归〉弹性网惩罚logistic回归〉L1正则化惩罚logistic回归;正确指数则表现为弹性网惩罚logistic回归〉LI正则化惩罚logistic回归〉L2正则化惩罚logistic回归。结论综合来看弹性网的筛选能力更优,弹性网融合L1、L2两种正则化的思想,在高维数据分析中既能保证模型的稀疏性,便于结果的解释,又解决了具有相关性自变量不能同时进入模型的问题。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社