作者:宁博 张菲菲人名消歧维基百科中文信息抽取层次聚类实体信息
摘要:针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在 Hadoop 平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《西安邮电大学学报》(CN:61-1493/TN)是一本有较高学术价值的大型月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《西安邮电大学学报》为满足本院师生和通信业科研、管理人员的学术交流需求,促进学院教学、科研水平的提高和我国信息产业的发展,主要刊登通信工程理论及技术、计算机理论及技术、信息产业发展中的经济管理理论以及相关基础理论研究和教育教学研究等方面的最新成果。
省级期刊
人气 238768 评论 36
人气 154370 评论 33
人气 152051 评论 53
人气 123508 评论 54