[发明专利]用于票据中磁码数据的增广方法、装置、设备和介质在审
申请号: | 202310650980.9 | 申请日: | 2023-06-02 |
公开(公告)号: | CN116597455A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 刘弘羿 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/148;G06V30/18;G06T5/50;G06T7/194 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 票据 中磁码 数据 增广 方法 装置 设备 介质 | ||
本公开提供了一种用于票据中磁码数据的增广方法,可以应用于人工智能技术领域。该方法包括:从原始样本集中的原始票据图像中提取磁码区域中图像内容,生成磁码条图像;利用所述原始票据图像的磁码区域中的背景中的像素替换所述原始票据图像中磁码区域中的图像内容,生成背景支票图像;转换所述磁码条图像为背景为透明的第一待融合图像;融合所述第一待融合图像的图像内容到所述背景支票图像中的磁码区域内,得第一增广图像;以及将所述第一增广图像扩充到所述原始样本集。本公开还提供了一种用于票据中磁码数据的增广装置、设备、存储介质和程序产品。
技术领域
本公开涉及人工智能技术领域,具体地涉及一种用于票据中磁码数据的增广方法、装置、设备、介质和程序产品。
背景技术
在对票据凭证的图像进行识别处理的过程中,往往需要先对票据图像进行分割,例如分割出不同的区域,如表格区域、logo标识区域、印章区域、磁码区域等,然后针对不同的区域可以针对性的训练相应的识别模型(如,光学字符识别模型等)来识别其中的字符、图标的信息或真伪。在分割磁码区域方面,由于有的支票中的磁码中存在特殊非通用字符或非通用字体,往往需要进行针对化训练,以此来提升模型准确分割磁码区域的能力。然后,目前拥有磁码的一类票据的真实样本通常较少,用规模过小的数据集进行训练后会造成过拟合,导致模型难以准确识别出支票图像中的磁码区域。为了增加模型对票据图像中的磁码区域的准确识别,可以通过数据增广的方式来增加具有磁码的票据,以此来增加训练中的样本数据。
现有的针对票据图像中磁码的数据增广方法中,通常是将票据图像中磁码区域去除保留支票背景,然后根据磁码区域的特征信息生成多个碎片图像,将其粘贴至支票背景,生成数据集。然而,将碎片图像进行粘贴后的图像,在粘贴边界处留下了处理痕迹,导致生成的票据图像与真实的票据图像明显不同,影响模型的泛化能力。
发明内容
鉴于上述问题,本公开提供了一种可以避免将碎片图像粘贴至背景图像会有痕迹的缺点,并使得生成的具有磁码的票据图像更加接近真实票据图像的用于票据中磁码数据的增广方法、装置、设备、介质和程序产品。
本公开实施例的第一方面,提供了一种用于票据中磁码数据的增广方法。该方法包括:获取原始样本集,所述原始样本集包括至少一个原始票据图像和所述原始票据图像中的磁码区域的原始位置标注信息;基于所述原始位置标注信息,从所述原始票据图像中提取磁码区域中图像内容,生成磁码条图像;利用背景像素替换所述原始票据图像中磁码区域中的图像内容,生成背景支票图像;其中,所述背景像素为所述原始票据图像的磁码区域中的背景中的像素;转换所述磁码条图像为背景为透明的第一待融合图像;融合所述第一待融合图像的图像内容到所述背景支票图像中,得第一增广图像;以及将所述第一增广图像扩充到所述原始样本集。
根据本公开的实施例,所述方法还包括:基于所述第一待融合图像的图像内容在所述第一增广图像中的融合位置,得到所述第一增广图像中磁码区域的第一位置标注信息。所述将所述第一增广图像扩充到所述原始样本集还包括:以所述第一增广图像和所述第一位置标注信息,扩充所述原始样本集。
根据本公开的实施例,所述方法还包括:基于从字符库中随机读取的字符以及字符排版设置,生成磁码条字符串,其中,所述字符库中存储有用于生成磁码的字符集合;按照随机生成的满足预定条件的偏移值,插入所述磁码条字符串至所述背景支票图像中,生成第二增广图像,其中,所述偏移值包括所述磁码条字符串插入至所述背景支票图像中时的上下左右偏移量;所述预定条件为上下左右偏移量的取值范围;以及将所述第二增广图像扩充到所述原始样本集。
根据本公开的实施例,所述方法还包括:基于所述偏移值,确定所述第二增广图像中的磁码区域的第二位置标注信息;以及所述将所述第二增广图像扩充到所述原始样本集包括:以所述第二增广图像及所述第二位置标注信息,扩充所述原始样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310650980.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置