作者:张章学社交网络敏感数据网络爬虫
摘要:随着大数据时代的到来,数据变得至关重要,但是数据获取一直是数据挖掘的一个难题。社交网络的成熟使得数据获取变得便捷,但是获取方法仍然有待研究。通过分析社交网络中的信息存储状况,构造了社交网络敏感数据获取模型。从获取用户的个人简介信息中得到用户性别、出生日期、所在地等信息,并通过浏览记录对用户兴趣进行分析,最后利用好友列表获取其整个社交网中用户的敏感数据。以新浪微博为例研究了用户敏感数据获取率。实验发现,在所有数据获取中职业获取率是最低的,而其它信息获取率较高。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社