HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于离群点检测的分类结果置信度的度量方法

作者:严云洋; 瞿学新; 朱全银; 李翔; 赵阳离群点网页分类k均值lof算法

摘要:为度量在网络日志中网页分类模型的预测结果,将度量为可信的结果加入网址分类集合,提高网络日志中访问链接的分类效率,提出一种基于离群点检测的分类结果置信度的度量方法.采用基于Bagging构建多个弱分类器对待分类数据进行预测,并对每个预测结果构建各类别的概率向量,根据离群点检测来度量模型的预测结果是否为可信.在UCI公共数据集上,使用主流的基于k均值和基于局部密度的度量方法进行了对比实验.实验结果表明,应用基于离群点检测的分类结果置信度,基于k均值的度量方法和基于局部密度的度量方法均显著提高了准确率.另外,在工程项目爬取的网页分类中也取得了同样的效果.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

南京大学学报·自然科学

《南京大学学报·自然科学》(CN:32-1169/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《南京大学学报·自然科学》报道内容包括数学、天文、计算机科学、物理、信息物理、化学、生物、生物化学、地球科学、大地海洋学、大气科学、环境科学、医学等学科的基础研究和应用研究。

杂志详情