[发明专利]基于二维码定位的表单识别方法及系统有效

专利信息
申请号: 202110185463.X 申请日: 2021-02-10
公开(公告)号: CN112966537B 公开(公告)日: 2022-12-09
发明(设计)人: 颜鑫;任多;张霞;王闫若显;梁宇海 申请(专利权)人: 北京邮电大学
主分类号: G06K7/14 分类号: G06K7/14;G06V30/14;G06V30/19;G06N3/04;G06N3/08
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 杨明月
地址: 100876 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 二维码 定位 表单 识别 方法 系统
【说明书】:

发明提供一种基于二维码定位的表单识别方法及系统,该方法包括:对待识别的表单进行扫描,获取表单图像,表单是在预设的表单模板上进行填写得到的;将表单图像和对应的表单模板进行匹配,根据匹配结果,获取表单图像中定位二维码的二维码位置偏移量,并根据二维码位置偏移量,得到表单图像中的文字区域坐标信息;根据文字区域坐标信息,获取表单图像中的文本区域图片,并将文本区域图片输入到训练好的文字识别模型中,得到表单图像的文字识别信息,训练好的文字识别模型是由样本文本区域图片,对卷积递归神经网络进行训练得到的。本发明有效克服文字检测阶段多目标检测带来的巨大开销,准确获取文本框的位置坐标,精确地将文字内容识别。

技术领域

本发明涉及图像识别技术领域,尤其涉及一种基于二维码定位的表单识别方法及系统。

背景技术

在银行、保险、证券、医疗、司法和档案管理等诸多领域中,存在着大量的需要把卡证、牌照、票据、表单、合同以及其他纸质文档录入的需求,而使用光学字符识别(OpticalCharacter Recognition,简称OCR)技术可以省去绝大多数文字录入的繁琐工作。OCR识别技术属于计算机视觉领域,将纸张、卡证和车牌之类载体上的文字,通过光学手段和技术手段翻译成计算机可以使用的电子化数据的过程。引入OCR识别技术可以省去业务录入的时间,使得原来需要三五分钟才能完成的工作,可以缩减到几秒钟,大大提升业务效率。

相比有着几十年发展历史的传统OCR技术来说,深度学习是个新兴事物。传统OCR的流程大都是:图像处理-二值化-版面分析-行切割-字切割-单字识别-后处理。自从2012年Imagenet竞赛中采用深度学习技术的AlexNet夺得冠军后,在图像视频领域,深度学习方法就已开始大幅超越传统算法,之后产生了新的基于深度学习的OCR识别技术。深度学习OCR的识别流程与传统大有不同,流程基本可以简化为:多目标检测-整行识别-后处理。在复杂版式的文字识别上,深度学习OCR相比传统OCR技术,具有压倒性的技术优势。

但是对于一些低算力的边缘计算设备,其无法满足多目标检测所需要的巨量GPU资源,只能使用压缩之后的低精度CPU模型进行计算,导致精度带来了巨大误差;同时,即使是使用GPU进行多目标检测本身,也需要对应的模板匹配进行后处理来确保精度。因此,现在亟需一种基于二维码定位的表单识别方法及系统来解决上述问题。

发明内容

针对现有技术存在的问题,本发明提供一种基于二维码定位的表单识别方法及系统。

本发明提供一种基于二维码定位的表单识别方法,包括:

对待识别的表单进行扫描,获取表单图像,所述表单是在预设的表单模板上进行填写得到的;

将所述表单图像和对应的表单模板进行匹配,根据匹配结果,获取所述表单图像中定位二维码的二维码位置偏移量,并根据所述二维码位置偏移量,得到所述表单图像中的文字区域坐标信息;

根据所述文字区域坐标信息,获取所述表单图像中的文本区域图片,并将所述文本区域图片输入到训练好的文字识别模型中,得到所述表单图像的文字识别信息,所述训练好的文字识别模型是由样本文本区域图片,对卷积递归神经网络进行训练得到的。

根据本发明提供的一种基于二维码定位的表单识别方法,所述训练好的文字识别模型通过以下步骤训练得到:

将样本表单的文字区域标记为文本框,构建得到训练样本集;

将所述训练样本集输入到卷积递归神经网络中进行训练,得到训练好的文字识别模型。

根据本发明提供的一种基于二维码定位的表单识别方法,所述根据所述二维码位置偏移量,得到所述表单图像中的文字区域坐标信息,包括:

获取表单模板中文字区域的文本框标注坐标;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110185463.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top