HI,欢迎来到学术之家,发表咨询:400-888-7501  订阅咨询:400-888-7502  股权代码  102064
0

文字识别中特征与相似度度量的研究

作者:李杰; 方木云概率特征结构特征相似度文字识别

摘要:在大样本测试集下国内现有成熟的OCR识别软件的首位识别准确率为95%~97%之间,在准确率和方法上仍有提升和改进的空间。提出一种基于概率特征和结构特征融合的自适应文字识别算法,模拟人类学习的模式,通过对训练样本的不断学习去构建汉字在测量空间的概率分布矩阵,然后比对原始图像和标准汉字库中汉字的概率分布矩阵的相似度来达到汉字分类的效果。其中相似度度量准则是从矩阵空间的结构和概率2个角度出发去构建的,充分考虑了结构模式识别和统计模式识别的优缺点。实验结果显示算法在训练样本下的首位识别正确率可以达到99.66%,在1 623张非训练样本文字图像下的首位识别正确率可以达到99.13%,在5 515张非训练样本文字图像下的首位识别正确率可以达到98.57%。可以证明提出的相似度度量方法在文字识别中的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

盐城工学院学报·自然科学版

《盐城工学院学报·自然科学版》(CN:32-1650/N)是一本有较高学术价值的季刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《盐城工学院学报·自然科学版》主要设置政治、法律、经济管理、文学、语言、历史、高等教育研究等栏目;同时,结合地方实际,学报还设立了“盐海文化”研究专栏。

杂志详情