HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于维基百科的领域概念语义知识库的自动构建方法

作者:张巧燕; 林民; 张树钧维基百科语义知识库关键词抽取语义相似度计算随机游走

摘要:针对为检索服务的语义知识库存在的内容不全面和不准确的问题,提出一种基于维基百科的软件工程领域概念语义知识库的构建方法。以SWEBOK V3概念为标准,从维基百科提取概念的解释文本,并抽取其关键词表示概念的语义;通过概念在维基百科中的层次关系、概念与其他概念的解释文本关键词之间的链接关系、不同概念解释文本关键词之间的链接关系构成概念语义知识库;利用LDA主题模型分别与TF-IDF、TextRank算法相结合的两种方法抽取关键词;对构建好的概念语义知识库用随机游走算法计算概念间的语义相似度。将实验结果与人工标注结果对比后发现,本方法构建的语义知识库语义相似度准确率能够达到84%以上,充分验证了所提方法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用研究

《计算机应用研究》(CN:51-1196/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《计算机应用研究》杂志以其新颖性、学术性、系统性、技术性于一身,瞄准国家迫切需要的前沿技术,及时反映并涵盖了国内外计算机学科领域最新发展趋势及技术动向,注重刊登反映本学科领域的新理论、新方法、新技术,选题新颖,可读性强而备受广大读者所喜爱,在各行各业拥有大量的读者、作者,在计算机业界享有崇高的知名度和影响力。

杂志详情