HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

改进的并行随机森林算法及其包外估计

作者:钱雪忠; 秦静; 宋威mapreduce随机森林包外估计泛化误差交叉验证

摘要:传统的包外估计记录全局数据与树之间的对应关系来测算泛化误差。然而基于MapReduce机制的并行随机森林算法(MR_RF)是建立在多个互不可见的分块数据上。对此分析MR_RF与RF的区别,设计了一个新的适用于MR_RF的包外泛化误差估计方法。主要将测算限定在数据块内,最终森林的泛化误差估计取块结果的平均。实验结果表明,新的包外估计方法与交叉验证在默认分块上的结果近似,却随着分块的增加出现偏差,对此分析了可能的原因,并给出选择集成方案思想,且分块大小与分类准确率成反比,与分类速率成正比。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用研究

《计算机应用研究》(CN:51-1196/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机应用研究》杂志以其新颖性、学术性、系统性、技术性于一身,瞄准国家迫切需要的前沿技术,及时反映并涵盖了国内外计算机学科领域最新发展趋势及技术动向,注重刊登反映本学科领域的新理论、新方法、新技术,选题新颖,可读性强而备受广大读者所喜爱,在各行各业拥有大量的读者、作者,在计算机业界享有崇高的知名度和影响力。

杂志详情