作者:冯元勇; 孙乐; 张大鲲; 李文波中文命名实体识别小规模尾字特征条件随机场自然语言处理机器学习
摘要:本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征。实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度。该系统在我国863简体命名实体识别评测语料上专名(人名、地名和机构名)总体F1值达88.76%,超过当年最佳系统8.63个百分点。在SIGHAN2006命名实体识别语料上的结果也居于前列。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社