作者:杨文忠; 彭曙蓉检测算法网页近似web信息检索搜索引擎系统向量空间模型检索效率局限性关键词www
摘要:用户进行Web信息检索时,网络往往返回大量的近似网页(可看作重复网页)。针对搜索引擎查询Web信息所存在的局限性,考虑到基于关键词匹配的搜索引擎系统的特点,结合使用网页的向量空间模型,采用以下算法快速、有效地发现WWW上的重复或相似网页,提高检索效率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《网络新媒体技术》(CN:10-1055/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
省级期刊
人气 213337 评论 71
部级期刊
人气 38461 评论 47
北大期刊、CSCD期刊、统计源期刊
人气 35989 评论 50
人气 29837 评论 47