HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

基于规则的百科人物属性抽取

作者:李红亮 杨燕 尹红风 贾真人物属性抽取规则获取自由文本

摘要:信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信息也是计算机所能理解的一种数据格式。作者提出了一种自动获取百科人物属性的方法,该方法利用各属性值的词性信息来定位到百科自由文本中,通过统计的方法发现规则,再根据规则匹配从百科文本中获取人物属性信息。实验表明该方法从百科文本中抽取人物属性信息是有效的。抽取的结果可以用来构建人物属性知识库。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

集成技术

《集成技术》(CN:44-1691/T)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《集成技术》集科学性、学术性、实用性与知识性为一体,以科研人员、高等院校师生以及工程技术人员为主要读者对象,诚邀国内外作者积极向本刊投稿,诚邀国内外专家学者为本刊审稿,诚邀国内外新老读者浏览阅读本刊,诚邀关心本刊的各界人士积极为本刊提出创新发展建议。

杂志详情