作者:靳简明; 丁晓青; 彭良瑞; 王华计算机应用中文信息处理文本切割字符切割字符识别维吾尔文
摘要:我国新疆地区使用的维吾尔文借用阿拉伯文字母书写.因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难.本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分.然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符.实验结果表明,字符切割准确率达到99%以上.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社