[发明专利]发票图像自动分类方法、系统、装置在审
| 申请号: | 202010644912.8 | 申请日: | 2020-07-07 |
| 公开(公告)号: | CN111797772A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 史存召 | 申请(专利权)人: | 因凡科技(北京)有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06Q40/00 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
| 地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 发票 图像 自动 分类 方法 系统 装置 | ||
1.一种发票图像自动分类方法,其特征在于,该方法包括:
步骤S100,获取待分类的发票图像,作为输入图像;
步骤S200,获取所述输入图像中发票监制章的检测区域,并对该检测区域进行设定尺寸的拓宽,得到包含发票名称的图像区域,作为第一区域;
步骤S300,获取所述第一区域中各文字的位置及识别结果,并根据位置对各文字的识别结果进行合并,得到发票名称识别结果,作为第一结果;
步骤S400,对所述第一结果,计算其与预构建的第一类别库中各发票名称的编辑距离,若所述编辑距离与其的长度的比值小于设定阈值,则通过对应的发票名称对其进行矫正,并得到所述输入图像对应的分类结果;否则执行步骤S500;所述第一类别库为基于发票名称构建的类别库;
步骤S500,将所述第一结果中的各关键词在预构建的第二类别库中检索并统计对应的类别,将次数最多的类别作为所述输入图像对应的分类结果;所述第二类别库为基于发票名称拆分的关键词构建的类别库。
2.根据权利要求1所述的发票图像自动分类方法,其特征在于,步骤S200中“获取所述输入图像中发票监制章的检测区域”,其方法为:通过基于深度学习的目标检测模型获取输入图像中发票监制章的检测区域。
3.根据权利要求1所述的发票图像自动分类方法,其特征在于,步骤S200中“对该检测区域进行设定尺寸的拓宽,得到包含发票名称的图像区域”,其方法为:
box2=(x-width,y,width*M,height)
其中,box2表示包含发票名称的图像区域,x、y、width、height分别表示检测区域的中心坐标和长、宽,M表示检测区域宽度拓宽的倍数。
4.根据权利要求3所述的发票图像自动分类方法,其特征在于,若所述拓宽后的检测区域超出所述输入图像的边界,则只保留边界内的区域作为包含发票名称的图像区域。
5.根据权利要求1所述的发票图像自动分类方法,其特征在于,步骤S300中“获取所述第一区域中各文字的位置及识别结果”,其方法为:对所述第一区域中的各文字,通过第一模型获取其的位置,并通过第二模型对其进行识别;所述第一模型为基于深度学习的文字识别模型,其在训练过程中的训练样本为带有汉字字符位置信息标注的发票名称区域图像;所述第二模型为基于深度学习的分类模型。
6.根据权利要求5所述的发票图像自动分类方法,其特征在于,所述第二模型其训练方法为:
通过样本合成的方式模拟发票名称字符样本生成大量汉字图像,对第二模型进行预训练;
预训练后,利用标记的发票名称单字图像的真实样本对第二模型进行微调训练。
7.根据权利要求1所述的发票图像自动分类方法,其特征在于,步骤S300中“根据所述位置对各文字的识别结果进行合并,得到发票名称识别结果”,其方法为:
将各文字按照顺序从上到下进行排序,并分成不同的文本行;
根据位置将每一文本行中的字符从左到右进行排序,并从左到右合并每一文本行中的字符识别结果;
从上到下合并所有文本行识别结果,得到发票名称识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因凡科技(北京)有限公司,未经因凡科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644912.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





