作者:谢忠红; 张琳; 孔佳玮新浪微博数据挖掘特征提取水军分类支撑向量基算法
摘要:基于微博内容对用户进行分类,为建设健康绿色的社交平台提供技术参考.改进支撑向量基算法 (SVM)实现多分类支持向量基模型,基于微博内容将用户分为4 类 ,利用新浪微博A P I使用网络爬虫获取微博 内容数据;然后对文本进行分词降维和特征词权重计算;最后设计一个微博内容实时爬取和识别系统,实现了基 于支撑向量基算法的水军实时检测.研究结果表明,提出的方法能够成功识别出正常用户和3 类水军.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社