HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

多特征融合文本聚类的新闻话题发现模型

作者:车蕾; 杨小平新闻话题多特征融合潜在狄利克雷分配向量空间模型

摘要:融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型。模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法。该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合。基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法。实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

国防科技大学学报

《国防科技大学学报》(CN:43-1067/T)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《国防科技大学学报》主要刊登航天工程、材料科学与工程、数学与系统科学、物理学、化学工程与技术、机械工程、控制科学与工程、电子科学与技术、信息与通信工程、管理科学与工程、计算机科学与技术、光学工程等学科领域的有创新性的论文,有创造性、实用性的技术成果报告,重要学术问题评述等。

杂志详情