HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于哈希方法的相似性搜索

作者:李丹阳; 程晓荣相似性搜索哈希算法空间向量高维数据搜索问题汉明距离查询效率存储空间

摘要:在解决高维数据的相似性搜索问题中,最具代表性的算法是局部敏感哈希算法,它将高维空间向量映射至低维汉明空间,并保持原空间向量相似性,使得新空间向量的汉明距离反映原空间向量相似度.本文介绍了局部敏感哈希算法的基本思路以及实现过程,分析了其还存在的不足——需要的大量的存储空间来保证查询效率.为此,尝试采用混合索引结构,在数据的搜索和处理过程对数据按出现次数进行分类,过滤无效数据,提高相似搜索的时间和空间效率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国科技信息

《中国科技信息》(CN:11-2739/N)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国科技信息》栏目有科技新闻、科技杂志要览、能源与环境、工程、农业、制造、交通运输、信息科技、现代服务、健康与生物医药、城镇化与城市发展、科技教育创新、基础及前沿研究、创新体系建设等。

杂志详情