HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于改进SVM算法的聚焦爬虫设计与实现

作者:乔平安; 田晶晶; 任静聚焦爬虫特征提取umsvm速率

摘要:聚焦爬虫在搜索引擎中有着至关重要的作用。为解决传统聚焦爬虫抓取特定领域的网页信息效率低下问题,在分析传统聚焦爬虫算法的基础上,提出了一种基于改进的支持向量机(SVM)的聚焦爬虫算法。该算法针对聚焦爬虫中网页特征提取问题,采用一种基于不确定性度量UM(Uncertainty Measure)值的权重特征提取方法对聚焦爬虫算法进行优化。实验结果显示,此特征提取方法大大提高了爬虫的速率,同时查全率和查准率也有提升。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机与数字工程

《计算机与数字工程》(CN:42-1372/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机与数字工程》始终秉承:"坚持理论联系实际;坚持实事求是的学风;坚持以应用为主,提高与普及并重;坚持创新;坚持以刊登国内外计算机方面的新理论,新技术,新工艺,新成果研究为主;以学术性,技术性为办刊宗旨。

杂志详情