基于POS-CBOW语言模型的相似词分析

作者：阮冬茹潘洪岩高凯自然语言处理语言模型词向量相似词

摘要：相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型（POS-CBOW）。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

河北科技大学学报

《河北科技大学学报》（CN：13-1225/TS）是一本有较高学术价值的大型双月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《河北科技大学学报》的主要目标和任务是为了促进学术交流传播科技信息，为教学、科研、生产服务，为“科教兴国”、为社会主义精神文明和社会主义物质文明建设服务。

杂志详情

服务推荐

河北科技大学学报相关期刊

基于POS-CBOW语言模型的相似词分析

服务推荐

在线咨询

杂志订阅

期刊推荐

科技资讯

科技创新与应用

中小企业管理与科技

科技风