基于词项聚类的文本语义标签抽取研究

作者：李雄; 丁治明; 苏醒; 郭黎敏语义抽取分布式表示假说聚类相似度

摘要：关键语义信息的问题。文本是自然语言的信息载体,在分析和处理文本信息时,由于目标与方式不同,对文本信息的特征表达方式也各不相同。已有的语义抽取方法往往是针对单篇文本的,忽略了不同文本间的语义联系。为此,文中提出了基于词项聚类的文本语义标签提取方法。该方法以语义抽取为目标,以Hinton的分布式表示假说为文本信息的表达方式,并以最大化语义标签与原文本数据间的语义相似度为目标,使用聚类算法对语义标签进行聚类。实验表明,所提方法由于是基于全体词汇表对语义信息分布进行聚类计算的,因此在语义丰富度和表达能力上相比很多现有方法具有更好的表现。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询在线咨询

计算机科学

《计算机科学》（CN：50-1075/TP）是一本有较高学术价值的大型月刊，自创刊以来，选题新奇而不失报道广度，服务大众而不失理论高度。颇受业界和广大读者的关注和好评。《计算机科学》报导国内外计算机科学与技术的发展动态，以其新颖、准确、及时为特色，突出动态性、综述性、学术性，“前沿学科”与“基础研究”相结合；“优秀技术”与“支撑技术”相结合；“倡导”与“争鸣”相结合。

杂志详情

服务推荐

计算机科学相关期刊

基于词项聚类的文本语义标签抽取研究

服务推荐

在线咨询

杂志订阅

期刊推荐

科技风

魅力中国

科学与财富

科学中国人