作者:牛俊磊 程龙生马田系统分类不平衡数据概率阈值模型全方位优化算法
摘要:在分类问题中,类别不平衡问题将引起分类器训练偏差,导致少数类样本诊断敏感性降低。马田系统是一种多元数据诊断和预测技术,它通过构建一个连续的测量尺度而非直接对训练样本进行学习,该性质有望不受数据分布的影响,克服分类不平衡问题。本文针对马田系统阈值计算缺陷和不平衡数据分类要求,研究一种概率阈值模型计算马田系统阈值;还针对马田系统的若干不足,采用优化模型替代正交表和信噪比筛选关键变量,并使用了一种全方位优化算法求解。通过对8个UCI数据集的实验分析表明,改进的马田系统不仅对不平衡数据有较好的分类效果,且能筛选关键变量,降维效果明显。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社