HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

中文文本中实体数值型关系无监督抽取方法

作者:吴胜; 刘茂福; 胡慧君; 张志清; 顾进广实体关系抽取无监督数值型三元组信息抽取

摘要:中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

武汉大学学报·理学版

《武汉大学学报·理学版》(CN:42-1674/N)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《武汉大学学报·理学版》是自然科学综合性学术期刊,主要刊登数学、计算机科学、物理学、空间物理学、化学、环境科学、生命科学等学科的最新研究成果。

杂志详情