作者:李知兵; 李龙澍中文分词数据驱动新词识别组合歧义
摘要:中文自动分词是计算机中文信息处理中的难题。介绍一种基于数据驱动的中文分词方法,开发了基于该方法的分词系统,此系统在北大《人民日报》标注语料库中进行封闭测试。取得较好的效果。系统包含了一个新词识别器、一个基本分词算法和实现单字构词、词缀构词以及一致性检验的程序。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《现代计算机》(CN:44-1415/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《现代计算机》是一本学科性、技术性较强的科技类学术期刊,作者读者群均面向计算机信息技术及应用研究开发设计生产的工程技术人员、大专院校师生及计算机爱好者。
部级期刊
人气 1075540 评论 53
省级期刊
人气 846648 评论 70
人气 808325 评论 68
人气 753957 评论 72