[发明专利]一种发票分块检测方法在审
| 申请号: | 201910051813.6 | 申请日: | 2019-01-21 |
| 公开(公告)号: | CN109858414A | 公开(公告)日: | 2019-06-07 |
| 发明(设计)人: | 桂冠;孟洋;孙颖异;李懋阳;杨洁 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;范青青 |
| 地址: | 210003 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 发票 块区域 检测 图像 目标块区域 分类类别 分块 精准定位 聚类方式 深远影响 图像输入 网络结构 文字识别 学习算法 智能定位 重要意义 卷积 采集 输出 回归 学习 图片 | ||
本发明公开了一种发票分块检测方法,所述方法包括以下步骤:采集待检测发票图像;将待检测发票图像输入至已训练好的深度学习模型中,回归得到发票图像的块区域和对应的分类类别;根据分类类别从块区域中提取目标块区域,输出被检测发票图像及对应的目标块区域图像,本发明结合Yolov3深度学习算法、K‑means聚类方式、采用全卷积与residual结构相结合的Darknet‑53网络结构对特征值进行提取,实现了对发票块区域精准定位和提取,本发明对图片的智能定位产生深远影响和重要意义,也为发票的进一步文字识别提高了准确性。
技术领域
本发明属于计算机视觉图像处理领域,具体涉及一种发票分块检测方法。
背景技术:
发票是财务管理中一项重要却又难整理的一项任务,大量的纸质发票若不及时整理,在空间和管理上会存在很多问题;人工录入和采集发票信息虽能扩大空间,但时间和准确率却不能很好的保证。随着科技的飞速发展,OCR对扫描出来的发票图像进行文字识别,给办公人员带来方便。在现有的发票文字识别技术中,办公人员需将增值税发票通过扫描仪进行图片扫描,然后对图片进行预处理、文字识别等操作。由于一整张的发票包含的信息极多,OCR对其进行文字识别时,有些内容无法精准的识别出来,采用基于深度学习的发票分块检测方法可以解决这一问题,对扫描出来的发票图像智能定位并提取,
以提高文字识别的准确度。
发明内容
本发明的目的在于提供一种发票分块检测方法,以解决现有技术中导致的上述多项缺陷。
一种发票分块检测方法,所述方法包括以下步骤:
采集待检测发票图像;
将待检测发票图像输入至已训练好的深度学习模型中,回归得到发票图像的块区域和对应的分类类别;
根据分类类别从块区域中提取目标块区域,输出被检测发票图像及对应的目标块区域图像。
优选的,所述深度学习模型为Yolov3网络中的Darknet-53神经网络模型。
优选的,所述深度学习模型的训练方法包括:
采集发票图像构建训练样本集;
为训练样本集中发票图像标记标签,使标签边框与发票图像的待检测区域重合;
针对标记后的发票图像,创建训练数据,生成对应的索引文件;
将训练样本集中发票图像对应的训练数据和标签输入至Darknet-53神经网络模型中,获取权重文件;
将索引文件及权重文件加载至Darknet-53神经网络模型的测试脚本中,完成深度学习模型的训练。
优选的,采用Label Img进行标签标记。
优选的,所述索引文件包括:my.cfg、my.data、my.name、train.txt文件。
优选的,方法还包括为Yolov3网络创建发票类别,Yolov3网络中无关类别全部屏蔽,不予检测。
优选的,所述目标区域通过调用Python-OpenCV的cv2模块提取。
优选的,所述分类类别的分类方法包括以下步骤:
采用Label Img为被检测发票图像打标签时,按块区域的不同,划分成不同的类别;给不同类别取相应的变量名,即类别名称;根据类别名称确定分类类别。
本发明的优点在于:本发明创造性地引入深度学习的方法,通过计算机迭代训练提取发票块区域的特征,能够准确地检测并精准定位到同类型发票的相同区域。本发明克服了传统利用图像匹配或利用坐标按行查找发票块区域的不普适性和不精准性,大大减少冗余度,具有较高的稳定性和鲁棒性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910051813.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





