HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于POS-CBOW语言模型的相似词分析

作者:阮冬茹 潘洪岩 高凯自然语言处理语言模型词向量相似词

摘要:相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

河北科技大学学报

《河北科技大学学报》(CN:13-1225/TS)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《河北科技大学学报》的主要目标和任务是为了促进学术交流传播科技信息,为教学、科研、生产服务,为“科教兴国”、为社会主义精神文明和社会主义物质文明建设服务。

杂志详情