HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于交叉熵与困惑度的LDA-SVM主题研究

作者:薛佳奇; 杨凡中文影视剧本isomap降维lda交叉熵困惑度svm

摘要:目前对于中文影视剧本的分类主要借助人工经验,具有成本高、效率低等特点.当前没有针对中文影视剧本主题自动分类的相关研究,本文将对主题提取进行研究,传统主题生成模型借助于文档和段落、段落和语句、语句和词的相似性,而忽略了文本语句与语句之间的相似性.首先,采用ISOMAP方法降低样本集的向量空间维度;其次,提出交叉熵结合困惑度的算法模型,进而确定LDA需要提取的最优主题数目;最后,通过剧本-主题的方式,利用LDA算法挖掘剧本的隐含主题词,同时利用SVM对主题词做出进一步的分类.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

智能计算机与应用

《智能计算机与应用》(CN:23-1573/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《智能计算机与应用》定位为“以学术和技术为主,兼顾应用”的学术期刊。本刊密切关注以计算机应用和学术研究为优秀的历史沿革、现状热点及发展趋势,也可集成计算机技术、方法和理论在通信、网络、自动控制等当代热门技术领域的先进应用成果,致力于打造展现计算机技术在多领域、多视角的学术和技术成果、切磋计算机应用经验的期刊交流平台。

杂志详情