短文本语义相似度计算研究

作者：张敏短文本语义相似度idf

摘要：文本相似度在同义词测试、信息抽取、文本分类、机器翻译等自然语言处理领域有着广泛的应用。在网络信息爆炸的今天,大量可用的信息如科学文献的摘要、说明、产品描述等以短文本形式呈现。当前关注大文件或独立词的相似度计算方法在短文本上的效果欠佳。对此提出一种短文本相似度计算方法,基于向量的余弦相似基线,使用一种将词与词之间的相似性和词的特异性指标结合到一起的方法来达到最佳的性能,在数据集上进行的实验表明,语义相似度方法优于基于简单词汇匹配的方法,其整体精确度提高,误差率显著降低。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

微型电脑应用

《微型电脑应用》（CN：31-1634/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《微型电脑应用》在长期办刊实践中，本刊形成了学术性和实用性并重的特色，主要栏目有：院士专家论坛、技术专题、研究与设计、开发应用、技术交流、学习园地等，它面向各行各业从事计算机应用的科技人员和广大电脑应用爱好者，沟通技术开发的信息渠道，为科研设计和推广应用牵线，为公司企业和各界用户搭桥。

杂志详情

服务推荐

微型电脑应用相关期刊

短文本语义相似度计算研究

服务推荐

在线咨询

杂志订阅

期刊推荐

电脑爱好者

电脑知识与技术

电脑迷

福建电脑