HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种在线数据清洗方法

作者:韩京宇; 胡孔法; 徐立臻; 董逸生清洗方法在线高维空间聚类划分分枝限界范围查询一维空间数据清洗字符串记录索引搜索元组匹配

摘要:提出一种新的在线数据清洗方法:将确认为干净的参照表中的记录字符串映射成高维空间中的点后进行聚类划分,然后利用B+树对划分中的点进行索引从而将高维空间的查询转换成一维空间的范围查询.输入表中的元组利用索引采用分枝限界策略搜索KNN(K nearest neighbors)记录从而完成与其最匹配记录的识别.理论分析和实验表明这是一种解决在线数据清洗的有效途径.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

应用科学学报

《应用科学学报》(CN:31-1404/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《应用科学学报》以强调科学的应用为其特色。主要刊登创造性科研成果,优先刊登前沿科学与技术领域中探索研究的新成果。除特约稿外,一般不刊登综合性和动态性文章。

杂志详情