[发明专利]文本识别方法、装置、设备及存储介质在审
申请号: | 202011495134.7 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112580499A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 卜德飞 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐敏 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 设备 存储 介质 | ||
1.一种文本识别方法,其特征在于,所述方法包括:
对目标类型的待测文本图片进行标注处理,得到候选文本图片,所述候选文本图片包括多个检测文本框,各所述检测文本框包括所述待测文本图片中的多个彼此间的距离小于预设距离阈值的文字;
获取与所述目标类型对应的模板图片,所述模板图片包括多个标准文本框,不同的所述标准文本框用于指示所述目标类型的样本文本图片中蕴含不同类型的信息的文本所在的区域;
对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理;
根据匹配处理的结果,从所述候选文本图片中提取目标类型的信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理,包括:
将所述模板文本图片叠加于所述候选图片之上进行滑动;
在每次滑动后,计算所述候选文本图片中的各检测文本框与所述模板图片中各标准文本框的交并比之和;
将计算得到的最大交并比之和对应的所述候选文本图片相对于所述模板图片的滑动位置作为最终相对位置;
基于所述最终相对位置对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理。
3.根据权利要求2所述的方法,其特征在于,所述计算所述候选文本图片中的各检测文本框与所述模板图片中各标准文本框的交并比之和,包括:
对于所述候选文本图片中的每个检测文本框,计算所述检测文本框与所述模板图片中每个标准文本框的交并比,并将计算得到的最大交并比作为所述检测文本框对应的候选交并比;
计算所述候选文本图片中的每个检测文本框对应的候选交并比之和。
4.根据权利要求2所述的方法,其特征在于,所述基于所述最终相对位置对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理,包括:
对于位于所述最终相对位置的所述候选文本图片中的每个检测文本框,计算所述检测文本框与位于所述最终相对位置的所述模板图片中每个标准文本框的交并比,并将计算得到的最大交并比对应的标准文本框作为与所述检测文本框相匹配的标准文本框。
5.根据权利要求1所述的方法,其特征在于,所述对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理,包括:
基于所述候选文本图片中各检测文本框的位置,确定所述候选文本图片中检测文本框的极值点,基于所述候选文本图片中检测文本框的极值点,在所述候选文本图片中建立第一坐标系,并获取每个检测文本框在所述第一坐标系中的坐标;
基于所述模板图片中各标准文本框的位置,确定所述模板图片中标准文本框的极值点,基于所述模板图片中标准文本框的极值点,在所述模板图片中建立第二坐标系,并获取每个标准文本框在所述第二坐标系中的坐标;
基于每个检测文本框在所述第一坐标系中的坐标和每个标准文本框在所述第二坐标系中的坐标对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理。
6.根据权利要求5所述的方法,其特征在于,所述基于每个检测文本框在所述第一坐标系中的坐标和每个标准文本框在所述第二坐标系中的坐标对所述候选文本图片中的检测文本框和所述模板图片中的标准文本框进行匹配处理,包括:
对于所述候选文本图片中的每个检测文本框,基于所述检测文本框在所述第一坐标系中的坐标,确定所述检测文本框在所述第二坐标系中的投射位置,并计算在所述检测文本框位于所述投射位置的情况下,所述检测文本框与各标准文本框的交并比,将计算得到的最大交并比对应的标准文本框作为与所述检测文本框相匹配的标准文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011495134.7/1.html,转载请声明来源钻瓜专利网。