作者:肖奎 谭小虎 吴天吉面向领域知识抽取维基百科分类条目
摘要:本体是许多应用程序运行的基础.维基百科作为互联网最重要的公共知识库之一,在构建本体方面具有明显的优势.本文提出一种新的方法,从维基百科抽取面向领域的语义知识,自动构建轻量级的本体.首先,维基百科的原始数据被加载到本地数据库.其次,指定领域的数据被抽取出来单独建立数据表.然后,计算指定领域里每个分类的相互性系数的值,并利用这些值从全部分类里筛选出了有意义的分类.以这些有意义的分类为基础,计算分类与条目的权值.最后,所有权值大于阈值的条目都被当作领域的概念.这些概念以及关系被用来构建本体.本文构建了一个软件领域的轻量级本体.此外,也利用了人工的方法对筛选出的软件领域的概念进行了评估.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社