作者:冯勇; 屈渤浩; 徐红艳; 王嵘冰短文本主题挖掘可变时间窗口时间影响因子lda
摘要:微博是社交网络的主要形式,其短文本和时效性的特点能够体现出当前大众最新兴趣取向.微博文本不同于传统文本,其时效性的特点使得在对其进行主题挖掘时容易忽略时间因素而造成结果不准确.针对此问题,提出了采用可变时间窗口的TIF-LDA微博主题模型对微博主题分析做出时间限定,并基于微博的时间为微博词条添加时间权重,使用词条的时间权重之和作为词条在LDA主题挖掘计算中的影响因子.实验结果表明,相较于标准的LDA主题模型,本文所提模型能够更加准确地反映用户最新的关注热点.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社