作者:黄德才; 戚华春; 钱能链接分析主题相似度pagerank算法
摘要:PageRank算法是著名搜索引擎Google的核心算法,但存在主题漂移的问题,致使搜索结果中存在过多与查询主题无关的网页.在分析PageRank算法及其有关改进算法的基础上,提出了基于虚拟文档的主题相似度模型和基于主题相似度模型的TS—PageRank算法框架.只要选择不同的相似度计算模型,就可以得到不同的TS—PageRank算法,形成一个网页排序算法簇.理论分析和数值仿真实验表明,该算法在不需要额外文本信息,也不增加算法时空复杂度的情况下,就能极大地减少主题漂移现象,从而提高查询效率和质量.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社