作者:李志磊; 蒋芸; 胡学伟; 沈健属性约简支持向量机
摘要:深入研究了基于β边界阈值选取的变精度粗糙集分类问题,提出β边界阈值选取新方法。由于以往变精度阈值β人为设定,面对复杂多变的多种类型的大数据集,其应用范围有限。因此提出平均包含度的概念,将平均包含度作为选取上下近似集的阈值,能够根据不同类型的数据集生成最优变精度阈值,将边界域中信息量较大的条件属性归入正域。实验结果表明,改进后的算法下近似集增加,上近似集减小,边界区域减小。在不增加额外训练时间的前提下,与传统可变精度粗糙集(VariablePrecisionRoughSet,VPRS)相比,分类精度明显提高。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社