HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于改进隐式狄利克雷分布算法的新浪微博话题检测

作者:袁弛; 余小清; 杨凯; 万旺根隐含狄利克雷分布新浪微博话题检测

摘要:提出了一个基于改进主题模型的微博话题检测算法。由于传统的主题模型主要适用于传统媒体文字,对短文本的处理效果不是很好。针对微博文本特有的数据结构,在文本聚类时先加入转发特征以及评论特征权重预处理方法。在此基础上,改进了传统的隐含狄利克雷分布主题模型用来提取热点微博数据中的主题。实验证明,与传统相比方法,改进的主题模型解决了传统主题检测方法在应用于短文本时存在的高维稀疏问题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

工业控制计算机

《工业控制计算机》(CN:32-1764/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《工业控制计算机》读者群涵盖电力、机械、石化、冶金、交通、通信、轻工、医药、智能建筑、仪器仪表等多个领域,成为国内知名的专业技术期刊之一,得到了广大工控、自动化界人士的认可。本刊适合从事工业控制、自动化仪器仪表应用、开发、研究的企业技术管理人员、科研院所研究人员及高校师生。

杂志详情