基于交叉熵与困惑度的LDA-SVM主题研究

作者：薛佳奇; 杨凡中文影视剧本isomap降维lda交叉熵困惑度svm

摘要：目前对于中文影视剧本的分类主要借助人工经验,具有成本高、效率低等特点.当前没有针对中文影视剧本主题自动分类的相关研究,本文将对主题提取进行研究,传统主题生成模型借助于文档和段落、段落和语句、语句和词的相似性,而忽略了文本语句与语句之间的相似性.首先,采用ISOMAP方法降低样本集的向量空间维度;其次,提出交叉熵结合困惑度的算法模型,进而确定LDA需要提取的最优主题数目;最后,通过剧本-主题的方式,利用LDA算法挖掘剧本的隐含主题词,同时利用SVM对主题词做出进一步的分类.

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

智能计算机与应用

《智能计算机与应用》（CN：23-1573/TN）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《智能计算机与应用》定位为“以学术和技术为主，兼顾应用”的学术期刊。本刊密切关注以计算机应用和学术研究为优秀的历史沿革、现状热点及发展趋势，也可集成计算机技术、方法和理论在通信、网络、自动控制等当代热门技术领域的先进应用成果，致力于打造展现计算机技术在多领域、多视角的学术和技术成果、切磋计算机应用经验的期刊交流平台。

杂志详情

服务推荐

智能计算机与应用相关期刊

基于交叉熵与困惑度的LDA-SVM主题研究

服务推荐

在线咨询

杂志订阅

期刊推荐

网友世界

计算机光盘软件与应用

计算机与网络

计算机仿真