HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

LDA模型在专利文本分类中的应用

作者:廖列法; 勒孚刚; 朱亚兰lda主题模型专利文本分类主题相似度

摘要:对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

现代情报

《现代情报》(CN:22-1182/G3)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《现代情报》以学术性、知识性、实践性为特色。主要报道国内外图书馆学、情报学理论和实践研究的最新成果及热点问题。

杂志详情