作者:夏火松; 李保国python语言静态地址动态链接动态网页评论爬虫算法
摘要:在大数据获取中面临着如何采集动态评论网页的问题,这篇论文使用静态网页信息构造动态链接,提出了基于Python的动态网页评论爬虫算法。在此基础上实现了评论收集程序。最后将它与通用爬虫算法进行比较,证实了该算法具有针对性强、数据采集速度快、易嵌入开发、简单等优点,为不善于编程的新闻、文学、管理等学科的研究者提供了快速获取评论信息的方法。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《软件工程》(CN:21-1603/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《软件工程》提供工厂技术及管理信息,营造信息时代的软件工程师文化。为中国软件行业协会会刊,被中国期刊全文数据库、中国知网、龙源期刊网、万方数字——数据期刊群以及中国优秀期刊(遴选)数据库等全文收录。
北大期刊、统计源期刊
人气 541402 评论 58
人气 226962 评论 63
部级期刊
人气 213375 评论 35
省级期刊
人气 184877 评论 72