[发明专利]单据拍摄图像识别方法及装置有效
| 申请号: | 202010337450.5 | 申请日: | 2020-04-26 |
| 公开(公告)号: | CN111582085B | 公开(公告)日: | 2023-10-10 |
| 发明(设计)人: | 张瀚文 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148;G06V30/19;G06V10/82 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;汤在彦 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 单据 拍摄 图像 识别 方法 装置 | ||
1.一种单据拍摄图像识别方法,其特征在于,包括:
应用预获取的目标单据拍摄图像中的各个文本区域框以及预设的图像坐标系,确定各个所述文本区域框各自对应的顶点坐标;
基于各个所述文本区域框各自对应的顶点坐标获取所述目标单据拍摄图像中的单据所在区域的位置信息,并根据该单据区域的位置信息自所述目标单据拍摄图像中提取对应的目标单据图像;
根据预定义的版式信息将所述目标单据图像切割为多个子区域,并对各个所述子区域分别进行文字识别。
2.根据权利要求1所述的单据拍摄图像识别方法,其特征在于,在所述应用预获取的目标单据拍摄图像中的各个文本区域框以及预设的图像坐标系,确定各个所述文本区域框各自对应的顶点坐标之前,还包括:
接收目标单据拍摄图像;
应用预设的文本区域框检测模型识别得到所述目标单据拍摄图像中的各个文本区域框。
3.根据权利要求2所述的单据拍摄图像识别方法,其特征在于,所述文本区域框检测模型为应用预设的advanced EAST算法获取的文本检测模型;
所述文本检测模型包括依次连接的输入模块、特征提取模块、特征融合模块和输出模块;
所述输入模块用于输入单据拍摄图像;
所述特征提取模块包括多个卷积层;
所述特征融合模块包括多个特征融合层和一全连接层;
所述输出模块仅包含有一用于输出单据拍摄图像中各个像素的激活分值的激活得分层。
4.根据权利要求3所述的单据拍摄图像识别方法,其特征在于,所述应用预设的文本区域框检测模型识别得到所述目标单据拍摄图像中的各个文本区域框,包括:
将所述目标单据拍摄图像输入所述文本区域框检测模型,并获取该文本区域框检测模型输出的所述目标单据拍摄图像中的各个所述像素的激活分值;
将所述激活分值大于预设激活阈值的像素选定为激活像素;
应用各个所述激活像素生成对应的激活像素分布图;
基于预设的图像轮廓检测算法获取所述激活像素分布图对应的各个文本区域框。
5.根据权利要求1所述的单据拍摄图像识别方法,其特征在于,所述图像坐标系的原点为内部文字处于正序排列状态下的目标单据拍摄图像的左上角顶点;
所述图像坐标系的横坐标正方向为自所述左上角顶点沿所述目标单据拍摄图像的横向边缘延伸的水平方向;
所述图像坐标系的纵坐标正方向为自所述左上角顶点沿所述目标单据拍摄图像的纵向边缘延伸的垂直方向;
相对应的,所述应用预获取的目标单据拍摄图像中的各个文本区域框以及预设的图像坐标系,确定各个所述文本区域框各自对应的顶点坐标,包括:
将所述目标单据拍摄图像中的各个文本区域框与所述图像坐标系中的横坐标和纵坐标相对应,得到每个所述文本区域框的各个角的顶点坐标。
6.根据权利要求5所述的单据拍摄图像识别方法,其特征在于,所述基于各个所述文本区域框各自对应的顶点坐标获取所述目标单据拍摄图像中的单据所在区域的位置信息,包括:
在各个所述文本区域框的各个角的顶点坐标中筛选一横坐标及纵坐标均为最小值的第一坐标,并筛选一横坐标及纵坐标均为最大值的第二坐标;
将所述第一坐标对应的顶点作为目标左上角顶点,并将所述第二坐标对应的顶点作为目标右下角顶点;
基于所述目标左上角顶点和目标右下角顶点生成对应的矩形框,并将该矩形框的位置信息确认为所述目标单据拍摄图像中的单据所在区域的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010337450.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





