作者:周俊生; 戴新宇; 尹存燕; 陈家骏自然语言信息抽取机器学习方法统计学习命名实体
摘要:信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的.近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注.本文深入探讨了当前自然语言信息抽取领域广泛采用的几种非常有效的统计学习方法,比较分析了各种方法的统计推断过程和学习算法及其优缺点,讨论了各种统计学习方法所面临的训练语料匮乏问题的主要解决方法,并指出了今后进一步研究的方向.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社