[发明专利]一种文档图像识别方法、装置、设备及存储介质在审

专利信息
申请号: 202211485917.6 申请日: 2022-11-24
公开(公告)号: CN115761747A 公开(公告)日: 2023-03-07
发明(设计)人: 张斌;李捷;陈鹏宇;赵逸如;张玉琦 申请(专利权)人: 上海浦东发展银行股份有限公司
主分类号: G06V30/148 分类号: G06V30/148;G06V30/146;G06T1/20;G06T1/60;G06N20/00
代理公司: 北京品源专利代理有限公司 11332 代理人: 黄立伟
地址: 200000 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文档 图像 识别 方法 装置 设备 存储 介质
【说明书】:

发明公开了一种文档图像识别方法、装置、设备及存储介质。该方法包括:通过第一处理器获取透射变换矩阵,并将透射变换矩阵拷贝至第二处理器;将至少一个第一图像从内存拷贝到第二处理器显存中,通过第二处理器多核并行根据透射变换矩阵对第一图像进行透射变换,得到透射变换后的至少一个第二图像,其中,所述第一图像为对文档图像进行划分得到的图像;将至少一个第二图像输入目标识别模型,得到每个第二图像对应的文本数据,通过本发明的技术方案,能够充分利用CPU和GPU的资源,提高CPU和GPU的利用率。

技术领域

本发明实施例涉及计算机技术领域,尤其涉及一种文档图像识别方法、装置、设备及存储介质。

背景技术

在金融场景中,通用文档主要指电子文档和扫描文件图片,包括密集长文本、倾斜图片以及表格类场景等,如信用证、提货单、存放同业合同、贸易合同以及财务报表等。在金融场景业务的日常工作中,每天会产生大量的数据录入需求,各厂商提供的通用文档OCR识别服务处于高并发场景下,通用文档OCR识别服务预测请求的平均响应延迟时间达不到业务要求,市面上的绝大多数同类产品一方面直接使用文本检测和文本识别训练得出的FLOAT32模型进行推测,模型的尺寸及内存消耗都比较大。

当前OCR服务是直接使用串行执行的方式,没有充分利用服务器端的硬件资源,通用文档端到端识别虽然能满足自动提取相关文档信息,但是CPU利用率低,导致CPU资源浪费。

发明内容

本发明实施例提供一种文档图像识别方法、装置、设备及存储介质,解决了OCR服务中CPU利用率低和CPU资源浪费的问题。

根据本发明的一方面,提供了一种文档图像识别方法,包括:

通过第一处理器获取透射变换矩阵,并将透射变换矩阵拷贝至第二处理器;

将至少一个第一图像从内存拷贝到第二处理器显存中,通过第二处理器多核并行根据透射变换矩阵对第一图像进行透射变换,得到透射变换后的至少一个第二图像,其中,所述第一图像为对文档图像进行划分得到的图像;

将至少一个第二图像输入目标识别模型,得到每个第二图像对应的文本数据。

根据本发明的另一方面,提供了一种文档图像识别装置,该文档图像识别装置包括:

矩阵拷贝模块,用于通过第一处理器获取透射变换矩阵,并将透射变换矩阵拷贝至第二处理器;

图像得到模块,用于将至少一个第一图像从内存拷贝到第二处理器显存中,通过第二处理器多核并行根据透射变换矩阵对第一图像进行透射变换,得到透射变换后的至少一个第二图像,其中,所述第一图像为对文档图像进行划分得到的图像;

文本得到模块,用于将至少一个第二图像输入目标识别模型,得到每个第二图像对应的文本数据。

根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的文档图像识别方法。

根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的文档图像识别方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211485917.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top