作者:杜仲舒; 王永利; 赵亮近似最近邻伪逆局部保留投影局部敏感哈希迭代量化
摘要:高维数据的近似最近邻检索是许多应用研究的一个基础问题,同时大数据带来的维度灾难对传统的哈希算法产生了挑战。为此论文提出了基于伪逆的局部保留迭代哈希算法(pseudo-inverse locality preserving iterative hashing,PLIH),不仅有效保持数据的近邻关系,同时解决了哈希过程中的矩阵奇异和量化损失较大的问题。在该算法中,构建邻接图并最小化近邻在低维空间的距离,保持投影后矩阵的高维近邻关系;采用伪逆替代逆矩阵解决了矩阵奇异的情况下求解投影矩阵失效的问题。最后通过迭代量化使得投影矩阵在量化过程中的损失降至最小。论文通过与其他哈希算法在公开数据集上的比较,发现正确率和召回率都有5%到10%的提升,证明了该算法的可行性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社