[发明专利]文本框的定位方法、装置、电子设备及存储介质在审
申请号: | 202111423997.8 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114170592A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李辉武 | 申请(专利权)人: | 珠海格力电器股份有限公司;珠海零边界集成电路有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/25;G06N3/04;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 杜欣 |
地址: | 519070*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本框 定位 方法 装置 电子设备 存储 介质 | ||
1.一种文本框的定位方法,其特征在于,包括:
在预设图像数据中检测第一目标,得到所述第一目标所对应的第一图像;
利用特征提取网络对所述第一图像进行处理,得到第一特征,其中,所述特征提取网络是根据第二图像和实测的该第二图像所对应的文本框训练生成的,所述第一特征用于表征所述第一图像所对应的文本框;
将所述第一特征进行栅格化,生成第一栅格信息,对从所述第一栅格信息中检测出的第二栅格信息按预设特征合并规则进行处理,生成第三栅格信息,其中,所述第一栅格信息用于表征所述文本框的文本元素在所述文本框内的位置,所述第二栅格信息包括与所述文本框内的所述文本元素所对应的所述第一栅格信息;
根据所述第三栅格信息,确定所述文本框的顶点所对应的位置信息和定位结果。
2.根据权利要求1所述的方法,其特征在于,所述第一特征包括对应的所述文本元素的得分图信息、元素分类信息和顶点坐标预测信息,将所述第一特征进行栅格化,生成第一栅格信息,包括:
从所述第一特征中获取所述得分图信息,其中,所述得分图信息用于表征所述文本元素为所述文本框内的文本元素的置信度;
根据所述得分图信息,生成与所述文本元素所对应的第一标记,其中,所述第一标记用于表征所述文本元素是否为文本框内的文本元素;
根据所述顶点坐标预测信息,生成所述文本元素在预设的栅格表中对应的第一坐标,其中,所述第一栅格信息包括所述第一标记、所述元素分类信息、所述第一坐标和所述顶点坐标预测信息。
3.根据权利要求2所述的方法,其特征在于,从所述第一栅格信息中检测出第二栅格信息,包括:
在所述第一栅格信息中检测所述第一标记,并根据所述第一标记确定位于所述文本框内的所述文本元素,其中,所述第二栅格信息包括位于所述文本框内的所述文本元素所对应的所述第一栅格信息。
4.根据权利要求3所述的方法,其特征在于,对从所述第一栅格信息中检测出的第二栅格信息按预设特征合并规则进行处理,生成第三栅格信息,包括:
从所述第二栅格信息中,获取对应的所述文本元素的所述第一坐标,并基于所述第一坐标进行文本元素区块合并,得到多个文本区块信息,其中,所述文本区块信息对应的文本区块包括起点文本元素和终点文本元素,所述起点文本元素和所述终点文本元素的所述第一坐标具有相同的第一坐标值,所述文本区块信息包括每个所述文本区块中的所述文本元素具有预设的区块标记;
遍历多个所述文本区块信息对应的所述文本区块,并根据所述文本区块的所述起点文本元素和所述终点文本元素的所述第一坐标,判断相邻的两个所述文本区块是否相交;
在判断到相邻的两个所述文本区块相交的情况下,将相邻的两个所述文本区块中的所述文本元素的所述区块标记更新为同一区块标记,并更新对应的所述文本区块信息;
基于所述第二栅格信息和更新后的所述文本区块信息,生成所述第三栅格信息。
5.根据权利要求4所述的方法,其特征在于,所述第一坐标包括所述第一坐标值和第二坐标值,根据所述文本区块的所述起点文本元素和所述终点文本元素所对应的所述第一坐标,判断相邻的两个所述文本区块是否相交,包括:
分别从相邻的两个所述文本区块的所有所述文本元素所对应的所述第一坐标中检测第一候选坐标和第二候选坐标,其中,所述第一候选坐标包括相邻的两个所述文本区块的所述起点文本元素的所述第一坐标,所述第二候选坐标包括相邻的两个所述文本区块的所述终点文本元素的所述第一坐标;
分别从所述第一候选坐标和所述第二候选坐标中检测第一目标坐标和第二目标坐标,其中,所述第一目标坐标包括所述第一候选坐标中所述第二坐标值最大的所述第一坐标,所述第二目标坐标包括所述第二候选坐标中所述第二坐标值最小的所述第一坐标;
判断所述第一目标坐标的所述第二坐标值是否小于所述第二目标坐标的所述第二坐标值,并在判断所述第一目标坐标的所述第二坐标值不小于所述第二目标坐标的所述第二坐标值的情况下,确定相邻的两个所述文本区块相交。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司;珠海零边界集成电路有限公司,未经珠海格力电器股份有限公司;珠海零边界集成电路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111423997.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:注塑件缩痕预测方法
- 下一篇:吸油烟机及其控制方法、模组及计算机可读介质