[发明专利]不规则文本校正方法、装置、计算机设备和存储介质在审
| 申请号: | 202010041116.5 | 申请日: | 2020-01-15 |
| 公开(公告)号: | CN111242126A | 公开(公告)日: | 2020-06-05 |
| 发明(设计)人: | 周康明;于洋 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄丽霞 |
| 地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 不规则 文本 校正 方法 装置 计算机 设备 存储 介质 | ||
1.一种不规则文本校正方法,其特征在于,所述方法包括:
定位待检测图像中的不规则文本区域,所述不规则文本区域为多边形区域;
根据所述多边形区域的各顶点确定对应的水平外接矩形区域;
对所述水平外接矩形区域进行字符检测,以得到所述水平外接矩形区域中各字符的第一目标区域;
对所述第一目标区域的角度进行水平校正;
识别进行水平校正后的所述第一目标区域中字符的方向,根据标准方向对进行水平校正后的所述第一目标区域中的字符进行方向校正,得到校正为标准方向的各字符的第二目标区域;
根据所述不规则文本区域中各字符的顺序,对校正为标准方向的各字符的第二目标区域进行拼接,得到目标文本区域。
2.根据权利要求1所述的不规则文本校正方法,其特征在于,所述对所述水平外接矩形区域进行字符检测,以得到所述水平外接矩形区域中各字符的第一目标区域,包括:
通过第一深度学习模型对所述水平外接矩形区域进行字符检测,以定位所述水平外接矩形区域中各字符分别对应的四边形区域,所述第一深度学习模型是采用标注了不规则文本中各字符轮廓的样本图像集训练基于深度学习的约束区域回归网络后得到的;
根据所述各字符分别对应的四边形区域的各顶点确定各字符的最小外接矩形区域;
将所述各字符的最小外接矩形区域确定为对应的第一目标区域。
3.根据权利要求1所述的不规则文本校正方法,其特征在于,所述定位待检测图像中的不规则文本区域,包括:
通过第二深度学习模型对所述待检测图像中的不规则文本进行检测,所述第二深度学习模型是采用标注了不规则文本区域的多边形轮廓的样本图像集训练基于深度学习的渐进式扩展网络后得到的;
得到包围所述不规则文本的多边形位置信息,根据所述多边形位置信息定位所述待检测图像中对应的多边形区域,将所述多边形区域确定为所述不规则文本区域。
4.根据权利要求1所述的不规则文本校正方法,其特征在于,所述识别进行水平校正后的所述第一目标区域中字符的方向,包括:
通过第三深度学习模型对进行水平校正后的所述第一目标区域中字符的角度进行分类,所述第三深度学习模型是使用不同方向的字符样本图像数据集训练基于深度学习的残差网络后得到的;
根据分类结果确定进行水平校正后的所述第一目标区域中字符的方向。
5.根据权利要求4所述的不规则文本校正方法,其特征在于,所述不同方向的字符样本图像数据集包括字符的角度为0度、90度、180以及270度的字符样本图像。
6.根据权利要求1所述的不规则文本校正方法,其特征在于,所述根据标准方向对进行水平校正后的所述第一目标区域中的字符进行方向校正,得到校正为标准方向的各字符的第二目标区域,包括:
若所述第一目标区域中字符的方向不是标准方向,则根据所述第一目标区域中字符的方向相对于所述标准方向的角度,对所述第一目标区域进行所述角度的逆时针旋转,得到校正为标准方向的第二目标区域。
7.根据权利要求1所述的不规则文本校正方法,其特征在于,所述对校正为标准方向的各字符的第二目标区域进行拼接,得到目标文本区域,包括:
获取各字符的第二目标区域的高度和宽度,并得到最大高度或最大宽度;
对于任意字符的第二目标区域,根据所述最大高度或最大宽度对所述第二目标区域进行高度扩充或宽度扩充;
对高度扩充或宽度扩充后的各字符的所述第二目标区域依次进行水平拼接或竖直拼接,得到规则排列的目标文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010041116.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据量的时空数据可视化方法
- 下一篇:一种配电箱





