HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于主题定制的专利网络爬虫的设计与实现

作者:张睿涵 林振荣 李建民 衷湾可定制关键词网络爬虫

摘要:目前,我国的网页数量已经达到三百多亿,并且正以年增长率超过百分之百的速度飞速增长。为了从众多的网页中快速高效准确地找到需要的信息,主题爬虫孕育而生,它从网络上选择用户需要的主题信息下载,为用户提供庞大的数据信息支持。本文研究可定制关键词(即主题)的基于.NET的更加精准有效的网络爬虫的设计和实现。通过实验及实际应用验证,该爬虫的精准率大大高于普通的爬虫。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机与现代化

《计算机与现代化》(CN:36-1137/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机与现代化》自创刊以来,以理论联系实际、促进应用开发为宗旨,主要刊登计算机专业方面的新理论、新技术及其在各个领域中应用成果的论文,设有系统分析与设计、软件工程、网络与通讯、过程控制、辅助设计、中文信息技术、人工智能、综合述评、应用与实践等栏目,既有相当的学术水平,又有现实的指导作用。

杂志详情