HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于词嵌入的微博谣言主题分类研究

作者:关菁华; 刘鑫; 刁建华微博谣言词嵌入主题分类文本向量

摘要:近年来,随着智能移动设备的普及,人们可以随时随地通过网络社交媒体获取与分享信息。然而,便捷的上网方式以及自由的网络空间,也为网络谣言的产生与传播提供了条件,广泛传播的谣言可能具有极大的破坏性。因此,及时识别谣言对于保障社会稳定具有重要意义。使用词嵌入对微博短文本进行向量化处理,然后使用朴素贝叶斯、K最近邻和支持向量机对文本向量进行主题分类,以期及时发现具有周期性出现特点的谣言。将该模型在中文谣言真实数据集上进行有效性验证,使用5487条数据作为训练集,2703条数据作为测试集进行分类实验。实验结果表明,K最近邻模型相比于朴素贝叶斯模型及支持向量机模型,在谣言主题分类任务中表现最佳,其F1值和分类准确率都达到0.93,表明基于词嵌入的谣言主题分类方法可及时发现周期性谣言。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

软件导刊

《软件导刊》(CN:42-1671/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《软件导刊》是关于软件开发与管理的学术期刊,以服务于软件的提供者与应用者、增强产业发展能力为宗旨,及时向读者传递软件行业的主流技术、研究热点、企业管理理念和项目管理模式,准确反映行业动态与最新发展趋势,为政府和企业信息化提供服务;总结软件应用中的经验和问题,探讨软件管理与技术人才培养的教育模式,积极促进软件科技成果产业化,为软件行业提供技术...

杂志详情