作者:周晓芳舰船资料数据库系统重复数据数据挖掘特征相似度
摘要:舰船资料数据库的数据存在一定量的重复,严重影响舰船资料数据库的工作效率。为了减少舰船资料数据库中的重复数据,降低存储空间,提出一种基于数据挖掘的舰船资料数据库数据去重复删除方法。首先分析当前舰船资料数据库中的数据去重复删除研究进展,找到各种方法的存在的问题与不足,然后提取舰船资料数据库的数据特征,采用数据挖掘技术计算舰船资料数据库数据特征的相似度,最后将相似度与阈值进行比较,删除大于阈值的数据,并进行仿真验证测试实验。结果表明,本文方法能够准确估计舰船资料数据库数据之间的相似度,可以很好地删除重复数据,且舰船资料数据库重复数据删除的速度快,具有一定的应用价值。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社