HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于红黑树的连续属性数据流快速决策树分类算法

作者:陈煜; 李玲娟数据流红黑树连续属性vfdtc决策树

摘要:以提高连续属性数据流的分类挖掘效率为目标,设计并实现了一种基于红黑树的连续属性数据流快速决策树分类算法VFDT_RBT。该算法利用红黑树来更有效地处理样本的插入,使得有序插入时的时间复杂度仍为O(nlogn);利用堆栈和红黑树中序遍历有序的特点来降低最佳划分阈值选取过程的时间复杂度;利用hoeffding不等式确定连续属性划分阈值所需的样本数量;在允许连续属性多次出现的原则下选择划分属性建立决策树,提高了算法的分类精度。在多个数据集上的分类实验结果表明:VFDT_RBT比已有的VFDTc具有更低的时间复杂度和更高的分类精度,更适合处理多属性样本。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京邮电大学学报·自然科学版

《南京邮电大学学报·自然科学版》(CN:32-1772/TN)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京邮电大学学报·自然科学版》主要刊登能及时反映代表学科前沿、学术上有特色的通信与信息系统、信号与信息处理、电磁场与微波技术、通信系统与通信网、图像通信与多媒体通信、移动通信与光通信、计算机软件与理论、计算机应用技术、信息安全与信息网络、控制理论与控制工程、模式识别与智能系统、物联网等学科或专业的学术论文、研究报告及综...

杂志详情