作者:张锋; 樊孝忠; 许云自动分词未登录词中文姓名识别
摘要:该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机工程与应用》(CN:11-2127/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
部级期刊
人气 246676 评论 65
省级期刊
人气 233362 评论 71
人气 227464 评论 35
统计源期刊
人气 211010 评论 73