作者:万红新; 彭云社交媒体主题模型语义约束lda模型时间关联
摘要:网络社交媒体文本中蕴含着丰富的评论主题信息,由于数据规模大、自然语言表达以及随时间变化等因素,增加了从文本中提取主题词的难度.根据中文社交媒体的语法结构及语义特征,利用LDA主题模型的文本降维及主题词语获取功能,并结合语义约束和时间关联提出了主题词链提取算法及模型.首先利用句法分析、词性关系和语境相关等进行词语语义关系获取,然后将语义和时间嵌入到LDA主题模型,构建符合中文社交媒体文本语法、语义结构特点的动态主题词链提取模型.实验结果表明,该模型可以改善LDA模型的语义理解功能和主题捕捉能力,提高主题词链提取的准确率和召回率.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社