[发明专利]一种文本朝向检测方法及装置有效
申请号: | 201810361308.7 | 申请日: | 2018-04-20 |
公开(公告)号: | CN108509960B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 吴爱红;胡金水;竺博 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06V30/184 | 分类号: | G06V30/184;G06V30/142 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 朝向 检测 方法 装置 | ||
1.一种文本朝向检测方法,其特征在于,所述方法包括:
获取待检测的文本图像;
根据预设规则提取所述文本图像中符合所述预设规则的目标连通体;所述目标连通体包括至少一个开口;所述预设规则包括目标连通体的形状特征和笔画特征;
根据所述目标连通体的开口方向,确定所述文本图像的朝向;
其中,若所述目标连通体无法确定所述文本图像的朝向时,则更换所述目标连通体,并继续利用新的目标连通体对所述文本图像的朝向进行检测或验证。
2.根据权利要求1所述的方法,其特征在于,所述根据预设规则提取所述文本图像中符合所述预设规则的目标连通体,具体包括:
提取所述文本图像中的连通体,得到第一集合;或者,提取所述文本图像的第一预设区域中的连通体,得到第一集合;
根据所述形状特征对所述第一集合中的连通体进行筛选,得到包括至少一个所述目标连通体的第二集合。
3.根据权利要求2所述的方法,其特征在于,所述形状特征,具体为:
连通体包括至少四个分别朝向上、下、左和右四个方向的开口,且朝向其中一个方向的开口数量不等于朝向其他三个方向中任意一个的开口数量;
或者,连通体包括至少三个分别朝向上、下、左和右中的任意三个方向的开口;
或者,连通体包括至少两个分别朝向两个方向的开口;所述两个方向中一个为上和下中的任意一个,另一个为左和右中的任意一个;
或者,连通体包括至少一个均朝向上、下、左和右中的任意一个方向的开口。
4.根据权利要求2所述的方法,其特征在于,所述根据所述形状特征对所述第一集合中的连通体进行筛选,得到包括至少一个所述目标连通体的第二集合,之后还包括:
将所述第二集合中的连通体输入预先得到的识别模型,获得至少一个符合所述笔画特征的连通体;
根据所述符合所述笔画特征的连通体,更新所述第二集合。
5.根据权利要求2-4任意一项所述的方法,其特征在于,所述根据所述目标连通体的开口方向,确定所述文本图像的朝向,具体包括:
统计所述第二集合中每个连通体的开口方向,将开口方向相同的连通体划分为一组;
比较每一组中连通体的数量;
将连通体数量最多的一组所对应的朝向,确定为所述文本图像的朝向。
6.根据权利要求5所述的方法,其特征在于,所述预设规则,包括:目标连通体的形状特征和笔画特征;当存在至少两个连通体数量最多的组时,所述方法还包括:
修改所述形状特征和/或所述笔画特征更换提取的目标连通体后,返回执行所述提取所述文本图像中的目标连通体。
7.一种文本朝向检测装置,其特征在于,该装置包括:图像获取模块、连通体提取模块和朝向确定模块;
所述图像获取模块,用于获取待检测的文本图像;
所述连通体提取模块,用于根据预设规则提取所述文本图像中符合所述预设规则的目标连通体;所述目标连通体包括至少一个开口;所述预设规则包括目标连通体的形状特征和笔画特征;
所述朝向确定模块,用于根据所述目标连通体的开口方向,确定所述文本图像的朝向;
其中,若所述目标连通体无法确定所述文本图像的朝向时,则更换所述目标连通体,并继续利用新的目标连通体对所述文本图像的朝向进行检测或验证。
8.根据权利要求7所述的装置,其特征在于,所述连通体提取模块,具体包括:第一提取子模块或第二提取子模块;所述连通体提取模块,还包括:筛选子模块;
所述第一提取子模块,用于提取所述文本图像中的连通体,得到第一集合;
所述第二提取子模块,用于提取所述文本图像的第一预设区域中的连通体,得到第一集合;
所述筛选子模块,用于根据所述形状特征对所述第一集合中的连通体进行筛选,得到包括至少一个所述目标连通体的第二集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810361308.7/1.html,转载请声明来源钻瓜专利网。