HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于机器学习的社交媒体用户分类研究

作者:李纲; 周华阳; 毛进; 陈思菁支持向量机用户分类机器学习特征提取

摘要:【目的】充分利用社交媒体用户的个人多维度信息,研究用户自动分类问题。【方法】将社交媒体用户定义为个体民众、媒体、政府和组织4种类型,从用户多维度信息中提取人口统计学、命名和自我描述三组特征,构建基于机器学习算法的用户自动分类模型,在Twitter真实数据集上通过实验对比各分类算法性能,并分析各组特征的贡献度。【结果】支持向量机和随机梯度下降分类模型的准确率和召回率均在83%以上,命名、人口统计学和自我描述特征对于分类性能的影响依次递增。【局限】由于标注的用户数量有限,可能无法让模型充分学习用户特征,而且没有考虑不同类型用户数量的不均衡问题。【结论】基于支持向量机和随机梯度下降的分类模型能够较准确地识别出4种类型用户,对后续社交媒体用户划分研究具有借鉴意义。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

数据分析与知识发现

《数据分析与知识发现》(CN:10-1478/G2)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数据分析与知识发现》内容定位于广泛吸纳计算机科学、数据科学、情报科学以及数字科研、数字教育和数字文化等领域的技术与方法,研究数据驱动的语义计算、内容分析、数据挖掘、知识发现、智能管理和决策支持等方面的技术、方法、系统以及支撑设施、政策与机制等,尤其是聚焦从海量、异构、分布、动态、甚至富媒体数据中挖掘和发现知识以支持研究、管理和决...

杂志详情