HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于众包的知识库索引对齐算法

作者:沈秉文; 冯建华知识库对齐实体对齐索引类别对齐众包

摘要:知识库对齐工作是近年来的热点研究问题.知识库对齐是将不同知识库中的实体、关系和类型进行对齐.由于知识库的规模巨大,并且不同知识库的结构差异太大,对齐工作有很多问题 和挑战 有待解决.从这些问题出发,且针对知识库里三种属性值,该文提出了三种索引结构,分别是基于字符串的前缀倒排索引、基于日期的 DateTrie、基于数字的线段树,并且通过指示函数将对齐的字面值传递到实体对齐,再利用实体与实体之间的结构性提高准确性,最后,采用机器和人工相结合的方式,控制一定的人工预算,减少问题的候选集,利用众包将类别进行对齐,提高准确性.该文在Yago-DBpedia上对比了所提出的方法、PARIS和Exact-string方法.PARIS得到的实体对达到93.5%的准确率和71.2%的召回率,耗时839 min,而Exact-string方法耗时只有1 min,但是召回率只有57.2%.相比于这两种方法,该文的方法达到90%的准确率和79.3%的召回率,耗时25 min,耗时比PARIS方法短,而召回率比 Exact- string高.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机学报

《计算机学报》(CN:11-1826/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情