词语相似度算法研究综述

作者：李慧词语相似度语义资源语料库维基百科wordnet

摘要：词语相似度计算方法在信息检索、词义消歧、机器翻译等自然语言处理领域有着广泛的应用。现有的词语相似度算法主要分为基于统计和基于语义资源两类方法,前者是从大规模的语料中统计与词语共现的上下文信息以计算其相似度,而后者利用人工构建的语义词典或语义网络计算相似度。本文比较分析了两类词语相似度算法,重点介绍了基于Web语料库和基于维基百科的算法,并总结了各自的特点和不足之处。最后提出,在信息技术的影响下,基于维基百科和基于混合技术的词语相似度算法以及关联数据驱动的相似性计算具有潜在的发展趋势。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

现代情报

《现代情报》（CN：22-1182/G3）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《现代情报》以学术性、知识性、实践性为特色。主要报道国内外图书馆学、情报学理论和实践研究的最新成果及热点问题。

杂志详情

服务推荐

现代情报相关期刊

词语相似度算法研究综述

服务推荐

在线咨询

杂志订阅

期刊推荐

科技情报开发与经济

图书情报导刊

轿车情报

情报科学