[发明专利]一种文本朝向检测方法及装置有效
申请号: | 201810361308.7 | 申请日: | 2018-04-20 |
公开(公告)号: | CN108509960B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 吴爱红;胡金水;竺博 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06V30/184 | 分类号: | G06V30/184;G06V30/142 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 朝向 检测 方法 装置 | ||
本发明实施例公开了一种文本朝向检测方法及装置,其中该方法包括:获取待检测的文本图像;根据预设规则提取文本图像中的目标连通体;目标连通体包括至少一个开口;根据目标连通体的开口方向,确定文本图像的朝向。本发明实施例利用文本图像中包括至少一个开口的特殊字符的开口朝向,来识别文本图像的朝向,一方面特殊字符在文本图像中均有出现,保证了朝向检测的可行性,扩宽了文本朝向检测适用范围;另一方面目标连通体的开口不易受到图像噪声的干扰,避免了噪声对朝向检测的影响,提高了文本朝向检测的准确度。
技术领域
本申请涉及图像处理技术领域,尤其涉及一种文本朝向检测方法及装置。
背景技术
在对实体文本进行数字录入时,首先需要对实体文本进行图像数据的采集,然后对采集的图像进行预处理,之后,再对预处理后的文本进行检测、分类及识别等各种处理步骤。在进行检测、分类及识别等各种处理步骤时,一般默认采集的图像数据中文本为正向,一旦出现采集的图像朝向旋转时,将会导致后续的各种处理步骤无法实现或准确率低。因此,在进行后续的各种处理步骤之前,检测录入的文本朝向是不可缺少的。
发明内容
有鉴于此,本申请实施例提供了一种文本朝向检测方法和装置,以避免采集的文本图像朝向错误对后续检测、分类及识别等步骤的影响,提高文本处理的准确性。
本申请实施例提供的文本朝向检测方法,包括:
获取待检测的文本图像;
根据预设规则提取所述文本图像中的目标连通体;所述目标连通体包括至少一个开口;
根据所述目标连通体的开口方向,确定所述文本图像的朝向。
可选的,所述预设规则,包括:目标连通体的形状特征;所述根据预设规则提取所述文本图像中的目标连通体,具体包括:
提取所述文本图像中的连通体,得到第一集合;或者,提取所述文本图像的第一预设区域中的连通体,得到第一集合;
根据所述形状特征对所述第一集合中的连通体进行筛选,得到包括至少一个所述目标连通体的第二集合。
可选的,所述形状特征,具体为:
连通体包括至少四个分别朝向上、下、左和右四个方向的开口,且朝向其中一个方向的开口数量不等于朝向其他三个方向中任意一个的开口数量;
或者,连通体包括至少三个分别朝向上、下、左和右中的任意三个方向的开口;
或者,连通体包括至少两个分别朝向两个方向的开口;所述两个方向中一个为上和下中的任意一个,另一个为左和右中的任意一个;
或者,连通体包括至少一个均朝向上、下、左和右中的任意一个方向的开口。
可选的,所述预设规则,还包括:目标连通体的笔画特征;所述根据所述形状特征对所述第一集合中的连通体进行筛选,得到包括至少一个所述目标连通体的第二集合,之后还包括:
将所述第二集合中的连通体输入预先得到的识别模型,获得至少一个符合所述笔画特征的连通体;
根据所述符合所述笔画特征的连通体,更新所述第二集合。
可选的,所述根据所述目标连通体的开口方向,确定所述文本图像的朝向,具体包括:
统计所述第二集合中每个连通体的开口方向,将开口方向相同的连通体划分为一组;
比较每一组中连通体的数量;
将连通体数量最多的一组所对应的朝向,确定为所述文本图像的朝向。
可选的,所述预设规则,包括:目标连通体的形状特征和笔画特征;当存在至少两个连通体数量最多的组时,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810361308.7/2.html,转载请声明来源钻瓜专利网。