HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于距离的自适应Web数据库记录匹配方法

作者:崔晓军 肖红宇 丁立新web数据库记录匹配实体识别比较向量权重向量

摘要:Web数据库环境的重复记录识别是Deep Web信息集成的重要步骤,具有查询依赖性、缺乏训练样本、在线处理要求等特征,导致现有的实体识别技术无法适用.在分析现有方法基础上,引入动态属性权重调整思想,提出基于距离的自适应记录匹配算法,在计算记录对的相似度时,加大匹配记录集合中相似度较大的属性的权重,并加大非匹配记录集合中相似度较小的属性的权重,迭代处理从而达到自适应动态调整各个属性权重的目标.该方法不需要训练样本,也不需要人工参与,实验结果表明其适用于Web数据库环境的重复记录识别处理.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉大学学报·理学版

《武汉大学学报·理学版》(CN:42-1674/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《武汉大学学报·理学版》是自然科学综合性学术期刊,主要刊登数学、计算机科学、物理学、空间物理学、化学、环境科学、生命科学等学科的最新研究成果。

杂志详情