作者:王加俊; 李艳玲; 黄贤武; 何振亚表格文本图像提取算法页面文字二值图像游程矩形中文实验结果
摘要:提出了一种从含有表格的文本图像的页面中提取文字的算法.该算法通过模板扫描形成包围图像前景像素的矩形框,从而提取出前景像素,进而组合矩形框形成模式链.利用模式的最大黑游程、长、宽三个统计特征实现对模式的分类.实验结果表明,该算法不仅对普通的表格有效,而且还可以从倾斜的表格及流程图中成功地提取出文字.本算法只适用于二值图像.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
《数据采集与处理》(CN:32-1367/TN)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度。颇受业界和广大读者的关注和好评。 《数据采集与处理》主要反映信号处理,测试工程和计算机应用等方面的科学成果,注重工程应用,力求创新。
北大期刊、CSCD期刊、统计源期刊
人气 31823 评论 52
部级期刊
人气 29465 评论 54
人气 28443 评论 50
统计源期刊
人气 24793 评论 49