作者:汤文亮; 汤树芳; 张平余弦测度web指纹识别算法
摘要:为了在Web指纹数据库中实现对Web指纹的准确识别,需要对Web指纹识别算法进行研究。采用当前识别算法对Web指纹数据库中的Web指纹进行识别时,识别的结果与实际结果之间存在误差、识别所用的时间较长,因此存在识别准确率低和识别效率低的问题。在余弦测度的基础上提出了一种Web指纹识别算法,在结构特征、静态文件、Cookie设计和关键字4个方面采用源码审计方法完成了对Web指纹的选取,建立了Web指纹数据库。首先提取Web指纹数据库中数据的特征,根据特征提取结果剔除Web指纹数据库中存在的异常数据;然后将余弦距离函数当作相似性度量函数,采用K-means算法对Web指纹数据库中的Web指纹进行聚类;最后根据聚类结果完成对Web指纹的识别。实验结果表明,所提方法可在较短的时间内准确地完成对Web指纹数据库中Web指纹的识别,具有识别准确率高和识别效率高的优点。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社