HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于word2vec和CNN的短文本聚类研究

作者:杨俊峰; 尹光花cnnword2vec短文本聚类特征提取

摘要:文本特征提取对短文本聚类效果至关重要,针对传统的基于统计学习的特征提取方法仅停留在特征词的层面,无法表达文本上下文语义特征的问题。基于此,笔者提出了一种基于word2vec词向量和卷积神经网络(Convolutional Neural Networks,CNN)的文本特征提取方法用于短文本聚类,首先利用word2vec工具训练大规模语料库中的词语,以低维向量的形式表征,然后利用CNN提取文本的深层语义特征,得到能够用于聚类的文本特征向量。实验结果表明,该方法可以有效提升短文本聚类的准确性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息与电脑

《信息与电脑》(CN:11-2697/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息与电脑》致力于打造一个政府及相关职能部门、研究机构、信息化软硬件及解决方案供应商、科技人才共同交流的平台,在内容上既注重信息化前沿科技,又立足现实应用的"虚实协调"策略。

杂志详情