作者:沈蕾; 石盛平; 燕继坤不平衡分类未标注数据baggingem
摘要:提出结合单边抽样Bagging与LPU的基本思想对不平衡数据进行分类。主要步骤是:将未标拄实例全标为反类,和正例一起训练单边抽样Bagging学习器,将得到的学习器对未标注实例分类得到可靠的反例(RN),再用正例和RN训练SSBagging学习器。使用Rocchio和EM进行分类是Liu等提出的一种有代表性的LPU。比较了这种LPU和该文提出的方法,发现当数据的不平衡性很明显时,后者要优于前者。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社