HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

房价预测机器学习之集成学习

作者:励嘉豪; 曾丹housingdatafeaturermsestackingengineeringboosting

摘要:房价预测是大数据处理的经典命题。本文基于kaggle平台的房价预测数据集,实现了特征分析、特征清洗、特征工程、特征选择、模型选择和集成学习。其中特征工程中对多达79个特征的处理以及使用Stacking进行集成学习是本文的亮点。除了stacking学习法,本文还尝试了boosting学习法的XGB和LGBM以及Bagging学习法,最终在kaggle.com的最好成绩为0.11274,在世界4000多只队中排名TOP4%,这证明本文模型有效得预测了房价同时避免了过拟合。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电子技术与软件工程

《电子技术与软件工程》(CN:10-1108/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情