[发明专利]多模板证书快速审证方法、系统、介质及装置在审
申请号: | 202110594815.7 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113343968A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 胡逸凡;杨铖;武宽;马楷 | 申请(专利权)人: | 广州云从人工智能技术有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/62;G06N3/08 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 刘江帅;宋宝库 |
地址: | 511458 广东省广州市南沙区丰泽*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模板 证书 快速 方法 系统 介质 装置 | ||
1.一种多模板证书快速审证方法,其特征在于,包括:
S01、接收待审核的证书图片;
S03、匹配所述证书图片对应的模板;
S04、基于所述模板中的预设ROI区域的坐标,框选所述证书图片中的实际ROI区域;
S05、通过已训练的OCR模型对框选的实际ROI区域的图片进行处理,获得所述实际ROI区域内的字段结果;
S06、对所述字段结果进行抽取,获得最终的证书信息;
S07、根据识别出的证书信息查询系统内录入的证书信息并据此进行待审核证书的真伪判别。
2.根据权利要求1所述的方法,其特征在于,步骤S01之后,所述方法还包括:
S08、将所述证书图片的格式转换成统一预设格式;并且/或者,
S09、通过分类模型确定的旋转方向对所述证书图片进行翻转矫正,其中,所述分类模型是基于深度神经网络的四方向分类模型,用于判断证件顺时针旋转方向;并且/或者,
步骤S03之后,所述控制方法还包括:
S11、基于匹配结果,判断所述证书图片相较于模板是否完整无误,当判断所述证书图片完整无误后执行下一步操作;
其中,完整无误的判定标准包括与模板相比是否缺页、多页、页数的顺序是否正确、每页是否完整。
3.根据权利要求1所述的方法,其特征在于,骤S01之后,所述方法还包括:
S02、通过已训练的OCR模型提取所述证书图片中的文本框及文字,基于所述文本框的坐标和所述文字的内容,继续执行下一步操作。
4.根据权利要求3所述的方法,其特征在于,步骤S02之后,所述方法还包括:
S10、根据每个文本框的四角坐标计算其与水平轴的倾斜角度,进而得到所述证书图片平均的倾角,并基于所述倾角的大小对所述待审核的证书图片进行旋转修复,当修复完成后执行下一步操作。
5.根据权利要求1所述的方法,其特征在于,
已训练的OCR模型是多语种OCR模型;并且/或者,
步骤S04进一步包括:
将所述模板所对应的关键词与所述证书图片中的文字的内容进行匹配,获得所述证书图片中的所有关键词的定位;基于所述证书图片中和所述模板中同样的两个关键词之间的距离的比值获得所述证书图片的缩放系数;获取所述模板的关键词与所有预设ROI区域的坐标之间的距离关系,经过缩放系数换算到所述证书图片中,获得所述证书图片中的实际ROI区域的坐标,并进行框选;并且/或者,
步骤S06中,对所述字段结果进行抽取的具体方式为:通过正则规则对所有字段结果进行抽取;并且/或者,
步骤S07中,证书信息包括证书编号,以及种类、件数、重量、运算工具号、铅封号、出口地址、进口地址中的至少一项。
6.一种多模板证书快速审证系统,其特征在于,包括:
图片接收模块:接收待审核的证书图片;
模板匹配模块:匹配所述证书图片对应的模板;
实际ROI区域确认模块:基于所述模板中的预设ROI区域的坐标,框选所述证书图片中的实际ROI区域;
图片二次识别模块:通过已训练的OCR模型对框选的实际ROI区域的图片进行处理,获得所述实际ROI区域内的字段结果;
证书信息提取模块:对所述字段结果进行抽取,获得最终的证书信息;
证书信息对比模块:根据识别出的证书信息查询系统内录入的证书信息并据此进行待审核证书的真伪判别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云从人工智能技术有限公司,未经广州云从人工智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594815.7/1.html,转载请声明来源钻瓜专利网。