作者:刘美华; 傅彩明; 梁开健; 周细凤网络图片文本定位最大稳定极值区域局部二值化校验连通域构造文本行
摘要:网络图片中的文本向用户提供了重要的语义信息,定位与识别网络图片中的文本能辅助网页内容的管理与搜索。本文提出了一种基于最大稳定极值区域(MaximallyStableExtremalRegions,MSER)和局部二值化的网络图片文本定位方法。首先,使用MSER方法提取网络图片多个图像通道中的连通域,并采用局部二值化方法精简连通域,保证较高的文字检测率,同时减少连通域的数量。然后,通过提取连通域的底层特征,校验连通域。最后,使用连通域构造文本行,分析文本行与相关连通域的特征,查找丢失的文字,得到完整的文本行,并通过后处理得到文本定位结果。本文方法能获得与传统MSER方法相当的文字检测率为92.76%,而平均每幅图像产生连通域的数量大幅减少为232。在文本定位标准数据集ICDAR2013数据集上,采用最新文本定位评价准则,本文获得文本召回率、准确率和F综合指标分别为82.28%、89.35%和85.67%;采用传统文本定位评价准则,本文获得文本召回率、准确率和F综合指标分别为87.05%、89.42%和88.22%。实验结果表明了基于MSER和局部二值化的文本定位方法的有效性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社