HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种用于数据流自适应分类的主动学习方法

作者:张银芳; 于洪; 王国胤; 谢永芳数据流概念漂移主动学习自适应分类

摘要:概念漂移会导致数据流分类模型的分类能力随时间发展而下降,这就要求分类模型有自适应的能力.现有的大多数自适应概念漂移的数据流分类模型往往假设数据输入分类模型得到预测标签之后就可以得到其真实标签,但这种假设在某些情况下是不合理的,因为数据标记往往成本高、耗时长.因此,针对数据流少量标签的问题,在考虑主动学习可能出现采样偏差的情况下,结合不确定性主动学习策略以及边界点和离群点检测方法(Boundary and Outlier Detection,BOD),提出一种新的主动学习方法ALBOD(Active Learning Based on Boundary and Outlier Detection).比较实验的结果表明,在概念漂移发生的情况下,与100%标记算法OzaBagAdwin(OBA)和HoeffdingAdaptiveTree(HAT)相比,ALBOD主动学习方法只需要平均20%左右的标签就可以使分类器保持同等分类精度,说明新方法ALBOD有良好的主动学习能力.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京大学学报·自然科学

《南京大学学报·自然科学》(CN:32-1169/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京大学学报·自然科学》报道内容包括数学、天文、计算机科学、物理、信息物理、化学、生物、生物化学、地球科学、大地海洋学、大气科学、环境科学、医学等学科的基础研究和应用研究。

杂志详情