作者:张慧; 侯开虎; 周洲knn算法距离度量熵值法加权
摘要:KNN算法是机器学习中一种监督式学习分类算法,KNN算法结构简单、分类效果显著,被广泛运用于多领域的分类问题中。由于传统的KNN算法在分类时没有考虑到样本的分类特征指标对分类结果的影响程度,因此本文提出一种以熵值法加权的KNN算法(EM-KNN算法),利用熵值法对样本的特征指标赋权,再在计算待测样本与训练样本距离时引入特征指标的权重,以某复烤厂复烤烟叶化学指标分类数据为测试样本,检验改进的KNN算法的有效性,又比较了不同度量距离公式、不同的K值下改进算法与传统算法的差异,通过在Jupyter Notebook交互式平台上对算法的实现和测试,结果验证了改进KNN算法提高了分类准确率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社