作者:吴培莎bp神经网络剔除冗余变量boostingbagging
摘要:本文使用CNSDA中2013年度的中国综合社会调查,首先筛选出可能有助于预测收入的客观因素,进行了异常值处理和类别合并,然后使用含单个隐层的BP神经网络进行建模,比较了隐节点不同的模型效果,发现隐节点为4的神经网络模型在训练集和测试集的综合表现效果最佳。接着根据模型重要变量分析结果剔除了个别冗余变量进行建模发现模型在测试集上的正确率有所提高。最后引进组合模型Boosting和Bagging发现模型虽然在训练集上预测精度有所改善,但是在测试集上的表现效果却不佳。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社