作者:谭翔纬学习资源网络爬虫heritrix
摘要:针对高校软件教学中有效学习资源获取困难的现状,拟通过对开源的网络爬虫框架Heritrix进行二次开发,在爬虫的网络资源识别、数据筛选等功能点上开展研究工作,提出一种基于主题的数据采集方案,并在此基础上实现一种基于指定主题的网络爬虫系统,以满足高校软件教学对高质量学习资源的需求。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《科学与信息化》(CN:12-1451/N)是一本有较高学术价值的大型旬刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《科学与信息化》杂志坚持正确的舆论导向,介绍信息化技术及其应用知识,传播科学理念,倡导创新精神,普及提高大众信息化知识水平。
省级期刊
人气 753957 评论 72
人气 485010 评论 71
人气 465037 评论 66
部级期刊
人气 442168 评论 69