HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于主题标签的在线社区话题发现

作者:周新民; 陈晓红; 钟敏娟; 赵文军话题发现主题标签大数据上下文分析向量空间模型

摘要:面对海量的互联网信息,如何快速有效地提取到用户关心的话题成为网络信息处理的一项基本任务。话题发现实质是无指导的聚类研究,本文引入主题标签概念,针对在线社区数据,提出了主题标签的话题发现算法。该算法以词项为粒度,基于词项的权重和上下文信息获取论坛帖子线索文档的核心词汇,作为文档的主题标签,在向量空间模型的基础上结合主题标签间的相似性进行相关话题的聚类。该方法的提出,一方面获得的主题词项不仅准确,而且具有较强的语义关联性,有效的避免了向量空间模型中容易丢失特征词间语义信息的缺陷;另一方面,与潜在语义模型相比,本文在向量空间模型基础上的话题发现具有更高的效率和更好的聚类质量。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

系统工程

《系统工程》(CN:43-1115/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《系统工程》是“国家自然科学基金委员会管理科学重要期刊”、始终坚持适应社会形势变化,加强杂志自身建设,进一步提高杂志的影响力和竞争力;坚持服务于国民经济建设主战场、服务作者和读者的思想;坚持严把质量关,不断提高杂志的档次,所有工作人员自觉维护杂志的声誉,提高发稿质量;坚持适应形势发展,不断推陈出新,推出新的栏目;坚持有一个团结一心、讲原则、高...

杂志详情