作者:许朝阳文本分类k近邻迭代距离
摘要:随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。KNN方法是一种简单、有效、非参数的分类方法。本文提出利用KNN分类器的封闭测试的结果对分类器进行调整修正系数的算法PIM-KNN(Parameter Iteratively Modified-KNN):错误分类的样本应该拉近与所属类别的"距离",而增大与被误判的类别的"距离"。实验结果表明,经过PIM-KNN算法调整的KNN分类器的分类效果得到显著提高。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社