HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于编辑距离和同义词词林的中文百科知识库三元组降噪方法研究

作者:谷函哲; 王汀; 高静; 刘经纬知识库编辑距离同义词词林相似度计算

摘要:知识库的提出为当下互联网社会中日益增长的数据的存储提供了良好的解决方案。近年来,英语领域的语义知识库自动化构建工作稳步发展,中文关联数据网的构建还未开发出成熟的体系。国内的互动百科和百度百科由于分词规则、数据融合技术等原因和当下自由开放式收集编纂百科词条的方式,用户在标注词条分类及编辑信息框时有很大的自由性,导致词条信息的不准确、不一致和冗余。论文提出一种基于编辑距离和同义词词林知识库结合的高效计算相似度的算法,该算法对规模较大的百科知识库三元组具有精炼和去噪效果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

信息系统工程

《信息系统工程》(CN:12-1158/N)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《信息系统工程》重点报道我国国民经济和社会信息化建设的方针、政策,交流信息系统建设的规划、方案和成果,介绍信息技术和应用的实例和经验,基本形成了信息技术多层次、多领域、多内容汇集一刊的特点,得到全国各级信息化领导和社会各界的充分肯定与好评。

杂志详情