HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

中文分类体系的构建与查询系统

作者:李金洋; 王燕华; 樊艳; 汪诚愚; 张蓉; 何...分类体系知识图谱支持向量机启发式规则维基百科

摘要:针对中文语言环境中缺少分类体系,无法明确实体类别并建立语义关系的问题,基于维基百科,提出一种混合架构,构建了大规模中文分类体系及其展示查询系统(CTCS2)。CTCS2包括两个模块:离线模块和在线模块。离线模块又分为SVM底层关系抽取子模块、顶层分类树构建子模块两部分。首先,采用SVM分类模型抽取语义关系,明确实体类别;然后,通过启发式规则、关联规则挖掘的方式挖掘上层抽象概念关系;其次,使用自底向上的算法从独立的关系中生成完整的中分分类体系,以分类树的形式展现;最后,在线模块分析展示了生成的分类树,并提供语义查询。实验表明,生成的语义关系的准确率高达95%;为评估分类体系包含中文知识的独特性,使用映射的方法生成YAGO的中文版本,YAGO-C,与之相比,CTCS2中仅有47.15%的实体被英文版本覆盖,说明了CTCS2的中文独特性。CTCS2为实体明确了类别类型、在类别类型间建立了语义关系,为构建中文知识图谱提供了基础的语义支持。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用

《计算机应用》(CN:51-1307/TP)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。

杂志详情