HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于主题模型的微博话题检测算法

作者:黄华军; 谭骏珊; 秦姣华话题检测主题模型文档词条矩阵词语关联矩阵

摘要:微博数据的实时、大规模、短文本以及富含噪声等特征为话题检测带来新的挑战,传统向量空模型(VSM)表示文本无法很好地对其进行建模。基于此,提出一种基于主题模型的微博话题检测算法。首先,对微博数据构建文档词条矩阵和词语关联矩阵来提取主题词;然后,对主题词进行聚类,得到主题模型;最后,利用文本与主题模型相互匹配实现文本聚类,从而达到话题检测的目的。实验结果表示,该算法能有效地进行话题聚类并检测出话题,在最佳参数组合条件下,其各类别的平均F值达到95%以上。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

网络与信息安全学报

《网络与信息安全学报》(CN:10-1366/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《网络与信息安全学报》通过刊载信息安全领域有突破的基础理论研究、创新性的关键技术研究、热点安全问题研究,以及与信息安全技术相关的交叉领域的科研学术论文,充分展示我国的研究成果,向科研人员提供全面的前沿信息,开展多边的网络国际交流合作,促进我国信息安全技术的发展与学术水平的提高,为建设网络强国服务。

杂志详情