HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

一种基于kmeans聚类算法和LDA主题模型的文本检索方法及有效性验证

作者:刘江华主题模型聚类分析文本检索

摘要:【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

情报科学

《情报科学》(月刊)创刊于1980年,由国家教育部主管,中国科学技术情报学会、吉林大学主办,CN刊号为:22-1264/G2,自创刊以来,颇受业界和广大读者的关注和好评。 《情报科学》内容涉及高校图书馆网络化建设、现代信息业发展、多媒体技术、情报人员结构等方面,本着求实创新的理念,始终站在学科研究的前沿,全面反映学科发展的动态,着力突出刊物与时俱进的时代特征,抓住图书情报界的研究热点,刊发了一大批既有理论水平,又有学术影响的重要论文,及时反映了情报学、信息管理、图书馆学等诸领域的最新研究进展。

杂志详情