[发明专利]发票关键信息定位方法、装置、计算机设备及存储介质有效

专利信息
申请号: 201910256914.7 申请日: 2019-04-01
公开(公告)号: CN110008956B 公开(公告)日: 2023-07-07
发明(设计)人: 张欢;李爱林;张仕洋 申请(专利权)人: 深圳华付技术股份有限公司
主分类号: G06V10/24 分类号: G06V10/24;G06V10/764;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08
代理公司: 深圳市精英专利事务所 44242 代理人: 冯筠
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 发票 关键 信息 定位 方法 装置 计算机 设备 存储 介质
【说明书】:

发明涉及发票关键信息定位方法、装置、计算机设备及存储介质,该方法包括获取待定位发票图像;将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;其中,卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U‑Net卷积神经网络所得的。本发明通过获取待定位发票图像,将待定位发票图像输入至以U‑Net卷积神经网络为基础网络的卷积神经网络模型,利用卷积神经网络模型先对待定位发票图像进行分类别后,再定位至待定位发票图像的关键信息部分,并输出发票关键信息,实现快速地定位出发票关键信息,且定位准确率高。

技术领域

本发明涉及文本检测方法,更具体地说是指发票关键信息定位方法、装置、计算机设备及存储介质。

背景技术

增值税普通发票是将除商业零售以外的增值税一般纳税人纳入增值税防伪税控系统开具和管理,也就是说一般纳税人可以使用同一套增值税防伪税控系统开具增值税专用发票、增值税普通发票等。企业和社会,个人,政府等有越来越多的发票需要整理,越来越多的时间耗费在发票上,手动录入和人工检索,不仅浪费时间,而且容易出错。急需自动化的设备进行识别。

现有文字识别系统多采用传统计算机视觉算法,未采用神经网络,准确率较低,大多需要配合扫描仪等设备进行扫描,在票据干净,整洁,而且很清晰时才能起到一定的识别效果,对自然场景下各种模糊的票据却大都无能为力。现有的大多数算法在现实中手机较为随意拍摄的任意角度真实数据上的效果不佳。尤其是当考虑到发票及其容易褶皱,褪色,且手机拍摄时面临多种光线和天气条件,多角度,多设备,透视等困难。

现有两种关于文本信息定位的方法,一是借助扫描仪定位关键信息的位置,并经过传统的计算机视觉手段对位置进行微调,但是这种方法要依赖于专门的扫描仪,非常不方便。而且要求票据褶皱较少,没法应对实际中褶皱发票;二是要求用户根据指令将票据在画面预对齐、摆正,检测所有的文字行,对检测的所有文字送入识别系统进行识别,并用非常复杂的后处理手段去进行版面分析,分析识别到的信息到底是什么信息。通常,采用此种方式很难将票据上大量的信息点进行结构对齐,并且由于多检测了很多多余的信息,这些多余信息中的错误将意外的影响本身关注信息的提取和定位,且后续的识别以及处理、分析中,将需要很多的计算资源。

因此,有必要设计一种新的方法,实现快速地定位出发票关键信息,且定位准确率高。

发明内容

本发明的目的在于克服现有技术的缺陷,提供发票关键信息定位方法、装置、计算机设备及存储介质。

为实现上述目的,本发明采用以下技术方案:发票关键信息定位方法,包括:

获取待定位发票图像;

将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;

其中,所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的。

其进一步技术方案为:所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的,包括:

获取带有特征标签的发票图像,以得到训练数据;

构建U-Net卷积神经网络;

利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。

其进一步技术方案为:所述利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型,包括:

将训练数据输入U-Net卷积神经网络内,以得到样本关键信息;

根据样本关键信息计算损失值;

根据损失值基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华付技术股份有限公司,未经深圳华付技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910256914.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top