作者:闫紫飞 姬东鸿条件随机场时间抽取时间识别半监督自训练
摘要:为提高文本中时间信息识别和抽取的效率,提出一种基于CRF (条件随机场)的方法。根据时间信息表现出的一般特点,采用机器学习的方法,通过分析文本中相关词性、短语结构和上下文信息等,提取时间信息的外部特征,采用一种自训练的半监督方法,使用CRF进行识别和抽取。实验结果表明,该方法有效提升了时间识别的性能,在显性时间、隐性时间和总体时间上分别取得了96?25%、88?65%和93?97%的 F1值。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社