HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于属性权值多级分类的测试样本数据预处理

作者:张建春; 李勃; 董蓉数据分类数据去重样本增量处理算法稳定性测试

摘要:针对算法测试在工业生产实际操作应用中,经常面临样本数据迅速大量增加,测试执行时间过长、测试效率低下、算法改进周期过长的问题。文章提出一种精简测试样本的算法,快速实时处理新增样本,去除冗余数据。首先对新增的样本数据按照分类阈值分配到各子数据集中,然后在每一个子数据集中根据数据的重要程度属性计算相似度值,为减少计算量,先对子数据集进行排序处理,最后根据相似性的阈值判断去除冗余数据。实验利用所得样本库不断对算法进行回归测试,分析表明算法的测试效率及测试充分性都有明显提升,并提高了算法在工业生产实际应用过程中的稳定性和适应性,有力的保证了算法的质量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

电视技术

《电视技术》(CN:11-2123/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情