作者:谭春亮 甘丹 陈丽娜 蒋运承特征选择tabu搜索算法深层网络信息检索分类算法分类器
摘要:Deep Web分类的小样本、高维特征的特点限制了分类算法的选择,影响分类器的设计和准确度,降低了分类器的“泛化”能力,出现分类器“过拟合”,所以需要进行特征选择,降低特征的维数,避免“维数灾难”。目前,没有Deep Web特征选择自动算法的相关研究。通过对Deep Web分类的特征选择进行研究,提出了基于类别可分性判据和Tabu搜索的特征选择算法,可以在2的时间复杂度内得到次优的特征子集,减小了分类器设计的难度,提高了分类器分类准确率。根据特征选择前后的特征集,利用KNN分类算法进行Deep Web分类,结果表明提高了分类器的分类准确率,降低了分类算法的时间复杂度。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社