[发明专利]一种发票分块检测方法在审

专利信息
申请号: 201910051813.6 申请日: 2019-01-21
公开(公告)号: CN109858414A 公开(公告)日: 2019-06-07
发明(设计)人: 桂冠;孟洋;孙颖异;李懋阳;杨洁 申请(专利权)人: 南京邮电大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林;范青青
地址: 210003 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 发票 块区域 检测 图像 目标块区域 分类类别 分块 精准定位 聚类方式 深远影响 图像输入 网络结构 文字识别 学习算法 智能定位 重要意义 卷积 采集 输出 回归 学习 图片
【说明书】:

发明公开了一种发票分块检测方法,所述方法包括以下步骤:采集待检测发票图像;将待检测发票图像输入至已训练好的深度学习模型中,回归得到发票图像的块区域和对应的分类类别;根据分类类别从块区域中提取目标块区域,输出被检测发票图像及对应的目标块区域图像,本发明结合Yolov3深度学习算法、K‑means聚类方式、采用全卷积与residual结构相结合的Darknet‑53网络结构对特征值进行提取,实现了对发票块区域精准定位和提取,本发明对图片的智能定位产生深远影响和重要意义,也为发票的进一步文字识别提高了准确性。

技术领域

本发明属于计算机视觉图像处理领域,具体涉及一种发票分块检测方法。

背景技术:

发票是财务管理中一项重要却又难整理的一项任务,大量的纸质发票若不及时整理,在空间和管理上会存在很多问题;人工录入和采集发票信息虽能扩大空间,但时间和准确率却不能很好的保证。随着科技的飞速发展,OCR对扫描出来的发票图像进行文字识别,给办公人员带来方便。在现有的发票文字识别技术中,办公人员需将增值税发票通过扫描仪进行图片扫描,然后对图片进行预处理、文字识别等操作。由于一整张的发票包含的信息极多,OCR对其进行文字识别时,有些内容无法精准的识别出来,采用基于深度学习的发票分块检测方法可以解决这一问题,对扫描出来的发票图像智能定位并提取,

以提高文字识别的准确度。

发明内容

本发明的目的在于提供一种发票分块检测方法,以解决现有技术中导致的上述多项缺陷。

一种发票分块检测方法,所述方法包括以下步骤:

采集待检测发票图像;

将待检测发票图像输入至已训练好的深度学习模型中,回归得到发票图像的块区域和对应的分类类别;

根据分类类别从块区域中提取目标块区域,输出被检测发票图像及对应的目标块区域图像。

优选的,所述深度学习模型为Yolov3网络中的Darknet-53神经网络模型。

优选的,所述深度学习模型的训练方法包括:

采集发票图像构建训练样本集;

为训练样本集中发票图像标记标签,使标签边框与发票图像的待检测区域重合;

针对标记后的发票图像,创建训练数据,生成对应的索引文件;

将训练样本集中发票图像对应的训练数据和标签输入至Darknet-53神经网络模型中,获取权重文件;

将索引文件及权重文件加载至Darknet-53神经网络模型的测试脚本中,完成深度学习模型的训练。

优选的,采用Label Img进行标签标记。

优选的,所述索引文件包括:my.cfg、my.data、my.name、train.txt文件。

优选的,方法还包括为Yolov3网络创建发票类别,Yolov3网络中无关类别全部屏蔽,不予检测。

优选的,所述目标区域通过调用Python-OpenCV的cv2模块提取。

优选的,所述分类类别的分类方法包括以下步骤:

采用Label Img为被检测发票图像打标签时,按块区域的不同,划分成不同的类别;给不同类别取相应的变量名,即类别名称;根据类别名称确定分类类别。

本发明的优点在于:本发明创造性地引入深度学习的方法,通过计算机迭代训练提取发票块区域的特征,能够准确地检测并精准定位到同类型发票的相同区域。本发明克服了传统利用图像匹配或利用坐标按行查找发票块区域的不普适性和不精准性,大大减少冗余度,具有较高的稳定性和鲁棒性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910051813.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top