作者:田秀娟网络存储不完整数据数据挖掘
摘要:传统的挖掘算法,对网络存储中的数据特征分类缺乏精确性,存在不完整数据挖掘误差大的问题。提出采用基于决策树的网络存储中的不完整数据挖掘方法。先对网络存储数据源进行预处理,形成决策树训练集,获取网络存储中每个数据属性的信息增益率,在对网络存储中数据的分支属性进行选择,得到各个数据类型的样本数量及样本权重及空间相似度,对网络存储中的不完整数据的可用性进行判断,预测网络存储中的不完整数据中未知属性的值,实现对网络存储中的不完整数据挖掘。仿真结果表明,采用改进的挖掘算法相比传统的挖掘算法提高了挖掘精确度和分类精确度,降低了误差率,间缩短了挖掘时,提高了挖掘效率,具有一定的优越性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社