[发明专利]文本识别方法、装置、设备及存储介质在审
申请号: | 202011495134.7 | 申请日: | 2020-12-17 |
公开(公告)号: | CN112580499A | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 卜德飞 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐敏 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 设备 存储 介质 | ||
本申请公开了一种文本识别方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:对目标类型的待测文本图片进行标注处理,得到候选文本图片,候选文本图片包括多个检测文本框,各检测文本框包括待测文本图片中的多个彼此间的距离小于预设距离阈值的文字;获取与目标类型对应的模板图片,模板图片包括多个标准文本框,不同的标准文本框用于指示目标类型的样本文本图片中蕴含不同类型的信息的文本所在的区域;对候选文本图片中的检测文本框和模板图片中的标准文本框进行匹配处理;根据匹配处理的结果,从候选文本图片中提取目标类型的信息。本申请实施例提供的技术方案能够提高文本关键信息的提取速度。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种文本识别方法、装置、设备及存储介质。
背景技术
文本识别技术有着很好的应用,当下能够通过对文本进行识别得到文本中蕴含的不同类型信息。
相关技术中,可以通过模板匹配的方法进行文本识别,具体地,可以先设计一个关键词图片,利用该关键词图片在待测图片上不停地滑动,每一次滑动后,对待测图片和模板图片上所有对应位置的像素的相似度求和,当像素的相似度和最大时匹配成功,最后对匹配成功后的结果进行文本识别。
但是,这种方法是进行像素级的对比进行匹配,降低了文本识别的速度。
发明内容
基于此,本申请实施例提供了一种文本识别的方法、装置、设备及存储介质,可以提高文本关键信息的提取速度。
第一方面,提供了一种文本识别的方法,该方法包括:
对目标类型的待测文本图片进行标注处理,得到候选文本图片,候选文本图片包括多个检测文本框,各检测文本框包括待测文本图片中的多个彼此间的距离小于预设距离阈值的文字;获取与目标类型对应的模板图片,模板图片包括多个标准文本框,不同的标准文本框用于指示目标类型的样本文本图片中蕴含不同类型的信息的文本所在的区域;对候选文本图片中的检测文本框和模板图片中的标准文本框进行匹配处理;根据匹配处理的结果,从候选文本图片中提取目标类型的信息。
在其中一个实施例中,对候选文本图片中的检测文本框和模板图片中的标准文本框进行匹配处理,包括:
基于候选文本图片的尺寸对模板图片的尺寸进行调整处理,得到调整模板图片,调整模板图片包括多个调整标准文本框;对候选文本图片中的检测文本框和调整模板图片中的调整标准文本框进行匹配处理。
在其中一个实施例中,基于候选文本图片的尺寸对模板图片的尺寸进行调整处理,包括:
计算候选文本图片中的各检测文本框的长的和,得到第一长度和值;计算候选文本图片中的各检测文本框的宽的和,得到第一宽度和值;计算模板图片中的各标准文本框的长的和,得到第二长度和值;计算模板图片中的各标准文本框的宽的和,得到第二宽度和值;基于第一长度和值和第二长度和值的比值对模板图片的长度进行调整处理,并基于第一宽度和值和第二宽度和值的比值对模板图片的宽度进行调整处理。
在其中一个实施例中,对候选文本图片中的检测文本框和模板图片中的标准文本框进行匹配处理,包括:
将模板文本图片叠加于候选图片之上进行滑动;在每次滑动后,计算候选文本图片中的各检测文本框与模板图片中各标准文本框的交并比之和;将计算得到的最大交并比之和对应的候选文本图片相对于模板图片的滑动位置作为最终相对位置;基于最终相对位置对候选文本图片中的检测文本框和模板图片中的标准文本框进行匹配处理。
在其中一个实施例中,计算候选文本图片中的各检测文本框与模板图片中各标准文本框的交并比之和,包括:
对于候选文本图片中的每个检测文本框,计算检测文本框与模板图片中每个标准文本框的交并比,并将计算得到的最大交并比作为检测文本框对应的候选交并比;计算候选文本图片中的每个检测文本框对应的候选交并比之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011495134.7/2.html,转载请声明来源钻瓜专利网。