HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于网络搜索数据的北京市旅游区客流量预测研究——基于五折交叉验证法的不同预测模型比较

作者:石峻驿; 周妮文; 钱源网络搜索数据旅游区客流量预测五折交叉验证法随机森林模型

摘要:本文以百度的整体搜索指数为网络搜索数据基础,采用直接取词法和范围取词法对北京市旅游的网络搜索关键词进行初选,并采用时差相关系数法和皮尔森相关系数法在初选的关键词中选择核心关键词。接着,选用逐步回归模型、分类回归树模型(classification and regression tree model)、随机森林模型(random forest model)、BP神经网络模型(back propagation neural network model)和支持向量机模型(support vector vachinemodel),采用五折交叉验证法,对北京市旅游区客流量进行预测分析。测试集的平均绝对百分误差(mean absolute percentage error,MAPE)和标准化均方误差(normalized mean square error, NMSE)值结果显示,五个预测模型中随机森林模型的预测效果最佳。与传统的预测方法相比,基于网络搜索数据的北京市旅游区客流量预测能够较好地解决拐点预测问题,同时预测的时效性更强,比官方统计调查数据的公布至少提前一个月。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

经济统计学

《经济统计学》是一本有较高学术价值的大型季刊,培养具有良好的数学与经济学素养,掌握统计学的基本理论和方法,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。

杂志详情