作者:王浩; 刘荣利; 黄登仕剪辑近邻算法预测股票原始数据聚类分析方法统计分布规律非线性系统证券市场样本相似系数稀疏数据实际应用模式识别判别标准欧氏距离能力不强规则分布估计方法高维空间
摘要:引言 聚类分析以某种度量(如欧氏距离、相似系数或关联度等)作为判别标准,其主要目标就是要识别存在于数据中的聚类或结构.近邻算法作为一种密度估计方法,是模式识别非参数法中最重要的方法之一.计算及存储量巨大是该方法最主要的缺点,严重影响了其实际应用.同时该算法对原始数据的容错能力不强,尤其当原始数据中包含过多噪声或异常样本也即各不同类别样本互相交错混杂没有明显的统计分布规律时,聚类结果很难令人满意.证券市场是一个公认的呈现高度复杂性的非线性系统,预测难度很大.传统的聚类分析方法遇到强有力的挑战,如对高维空间的稀疏数据以及不规则分布具有任意形状数据的分析.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社