作者:傅向华; 冯博琴; 马兆丰; 何明链接分析主题提取web查询资源发现
摘要:HITS(Hypertext-Induced Topic Search)算法被广泛用于Web链接结构分析,但它很容易产生主题漂移.从语义相关性角度进行分析,发现HITS算法产生主题漂移的原因在于页面被投影到错误的潜在语义基上.提出一种基于查询扩展的超链主题提取算法,利用用户查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,再利用HITS算法计算Web页面的权威值和中心值.实验结果表明,基于查询扩展的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社