HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于网络爬虫的新浪微博数据分析网站的建立

作者:赖敬之新浪爬虫数据分析

摘要:新浪微博作为国内最大的社交网站,蕴含着丰富的信息。本文实现了一个微博数据分析网站,该网站的后端利用爬虫实时抓取数据并存储到redis数据库中,前端利用ajax轮询技术和数据可视化技术将统计分析后的数据展示到网页。相对于直接调用新浪微博的API,网络爬虫获取数据的方式有更大的灵活性,可以获取到的数据也相对较多,但是也存在一些限制,其中最大的阻碍就是新浪微博的反爬虫技术,本文也将对如何突破反爬虫限制进行探讨。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

通讯世界

《通讯世界》(CN:11-3850/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《通讯世界》更是目前国内惟一通过BPA国际发行量认证的通信专业媒体。主要读者对象为各大运营商、企业及组织机构的高级管理人士和技术经理等。

杂志详情