HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于词向量的话题焦点识别方法

作者:张佩瑶; 刘东苏网络话题焦点特征词词向量btm相似度计算

摘要:【目的/意义】移动互联网时代,微博以其快速、便捷的优点迅速成为信息传播与共享的平台之一。在互联网信息传播过程中,话题内容焦点会随着时间推动发生动态迁移,及时准确的发现话题内容焦点的迁移有助于了解网络舆情的演化趋势。【方法/过程】首先,定义基于焦点特征词分布的焦点词提取公式,构造焦点特征词集合;然后,使用Skip-gram模型在大规模语料上训练得到词向量,再通过BTM对文本建模,直接在BTM主题维上结合焦点特征词集合构造主题词向量;最后,计算主题特征词间的相似度,将其应用到聚类算法中实现话题焦点识别。【结果/结论】通过对新浪微博数据集上的实验结果表明,本方法能够充分利用词向量引入的语义信息,提高文本聚类效果,有效的获取各阶段的话题焦点。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报科学

《情报科学》(月刊)创刊于1980年,由国家教育部主管,中国科学技术情报学会、吉林大学主办,CN刊号为:22-1264/G2,自创刊以来,颇受业界和广大读者的关注和好评。 《情报科学》内容涉及高校图书馆网络化建设、现代信息业发展、多媒体技术、情报人员结构等方面,本着求实创新的理念,始终站在学科研究的前沿,全面反映学科发展的动态,着力突出刊物与时俱进的时代特征,抓住图书情报界的研究热点,刊发了一大批既有理论水平,又有学术影响的重要论文,及时反映了情报学、信息管理、图书馆学等诸领域的最新研究进展。

杂志详情