作者:李继锋; 刘群编码识别n元语法模型一元语法模型自动识别文档汉字编码
摘要:该文提出了一个应用n元语法模型(N—Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni—Gmm,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《计算机工程与应用》(CN:11-2127/TP)是一本有较高学术价值的大型半月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。
部级期刊
人气 230041 评论 65
人气 214521 评论 35
省级期刊
人气 212896 评论 71
北大期刊、统计源期刊
人气 193027 评论 73