HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

新浪API与网络爬虫结合获取数据的研究与应用

作者:石磊数据挖掘网络爬虫新浪api获取数据

摘要:微博是近几年来兴起的一种社会化网络,类似于国外的twitter和facebook等社交网络,随着社交网络的发展,产生了大量的用户数据。如何有效的从这些大量的数据中提取到我们感兴趣的知识,成为数据挖掘领域重要的问题。由于单独使用网络爬虫或者新浪API接口获取新浪微博中电商用户数据,无法一次性完成获取数据的任务。所以,本文主要介绍一种基于新浪API接口和网络爬虫相集合的方法获取新浪微博中用户数据的方法,设计方法中主要解决了新浪API接口的访问频率限制和网络爬虫需要下载大量页面的问题,并且结合了两种方法的优点。最后,采用统计性试验,对本文新提出的方法和传统的方法进行比较研究。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

中国电子商务

《中国电子商务》(CN:11-4440/F)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《中国电子商务》内容深度诠释信息时代的中国电子商务发展走向、实施电子商务的最佳战略与我国“信息化”进程息息相关的内在本质;着力追踪报道深刻影响我国当前商务活动的信息化最新方向;精准反映我国实施信息化建设的最新政策动态、市场动态及其所蕴涵的巨大商机,是企业寻求与政府沟通的最好平台,也是所有追求成功的商界决策人士的最佳选择。

杂志详情