[发明专利]证照信息识别方法、装置、设备及介质在审
申请号: | 202210140058.0 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114494751A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 施胜杰 | 申请(专利权)人: | 国泰新点软件股份有限公司 |
主分类号: | G06V10/75 | 分类号: | G06V10/75;G06V10/24;G06V20/62;G06V30/148;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 岳晓萍 |
地址: | 215600 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 证照 信息 识别 方法 装置 设备 介质 | ||
本发明公开了一种证照信息识别方法、装置、设备及介质,该方法通过获取待识别的证照图像对应的模板图像,根据模板图像中的锚点字段与证照图像中的文字内容的匹配结果,计算模板图像与证照图像之间的单应性变换矩阵,进而根据单应性变换矩阵在证照图像中确定与模板图像的待识别区域所对应的字段内容,通过该字段内容以及模板图像中的键值对关系,确定证照图像的键值对输出结果,实现了证照图像中的键值对信息的自动提取,进而实现了证照中结构化信息的自动获取,解决了现有技术无法获取证照的结构化信息的技术问题。
技术领域
本发明涉及光学字符识别技术领域,尤其涉及一种证照信息识别方法、装置、设备及介质。
背景技术
光学字符识别技术(Optical Character Recognition,OCR),是指将图像中的文字进行定位与识别,翻译成计算机文字,以供后续文字处理模块进一步编辑加工。
一般的OCR给出往往是按行识别的结果,但是在许多应用场景中,仅提取出图片中的文字信息是不足以满足业务需求的,尤其实在证照、票据类的识别应用中,用户更需要带有字段定义的结构化表示,即key-value形式的结构化数据。因此,现有技术存在无法获取证照中的结构化信息的技术缺陷。
发明内容
本发明提供了一种证照信息识别方法、装置、设备及介质,以获取证照图像中的键值对信息,解决现有技术无法获取证照图像中的结构化信息的技术问题。
根据本发明的一方面,提供了一种证照信息识别方法,该方法包括:
确定待识别的证照图像,获取所述证照图像对应的模板图像,其中,所述模板图像包括锚点字段、待识别区域以及所述待识别区域对应的键值对关系;
基于所述锚点字段与所述证照图像中的文字内容的匹配结果,计算所述证照图像与所述模板图像之间的单应性变换矩阵;
基于所述单应性变换矩阵,确定在所述证照图像中所述待识别区域对应的字段内容;
基于所述字段内容以及所述键值对关系,确定所述证照图像的键值对输出结果。
可选的,所述方法还包括:
基于预先训练的目标检测模型对所述证照图像进行切割,以使切割后的所述证照图像仅包括证照区域;
基于预先训练的文字提取模型,获取所述证照图像中的文字内容。
可选的,在所述基于预先训练的目标检测模型对所述证照图像进行切割之前,所述方法还包括:
基于所述目标检测模型确定所述证照区域在所述证照图像中的比例;
若所述证照区域在所述证照图像中的比例满足预设阈值,则执行基于所述目标检测模型对所述证照图像进行切割的操作。
可选的,在所述基于预先训练的目标检测模型对所述证照图像进行切割之后,所述方法还包括:
基于预先训练的文字检测模型,确定所述证照图像中的各个文字区域;
基于预先训练的文字角度分类模型,确定各所述文字区域对应的方向,基于各所述文字区域对应的方向确定所述证照图像对应的方向;
若所述证照图像对应的方向不满足预设朝向条件,则对所述证照图像进行旋转处理。
可选的,所述获取所述证照图像对应的模板图像,包括:
基于所述目标检测模型确定所述证照图像对应的证照类型;
获取所述证照类型对应的模板图像,将所述证照类型对应的模板图像作为所述证照图像对应的模板图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国泰新点软件股份有限公司,未经国泰新点软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210140058.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置