[发明专利]图片样本集生成方法、装置、计算机设备和存储介质有效
| 申请号: | 202011510018.8 | 申请日: | 2020-12-18 |
| 公开(公告)号: | CN112613553B | 公开(公告)日: | 2022-03-08 |
| 发明(设计)人: | 刘洋 | 申请(专利权)人: | 中电金信软件有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774 |
| 代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 樊春燕 |
| 地址: | 100192 北京市海淀区西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 样本 生成 方法 装置 计算机 设备 存储 介质 | ||
1.一种图片样本集生成方法,其特征在于,所述方法包括:
获取票据的常用字符,组成对象集;
针对所述对象集中的各个待识别对象,分别获取各个所述待识别对象的图片生成参数;所述图片生成参数包括字体、字号、字符颜色和在图片中的位置;
生成与所述图片生成参数对应的初始图片;
对所述初始图片进行第一处理操作,得到各个所述待识别对象对应的测试样本集;所述第一处理操作为背景添加操作、噪声添加操作、仿射变换和透视变化中的至少一种;
通过图片识别模型对各个所述待识别对象对应的测试样本集中的测试样本进行识别操作,根据识别结果确定各个所述待识别对象的识别准确率;
将识别准确率低于准确率阈值的待识别对象,作为待强化对象;
对所述待强化对象的所述初始图片进行第二处理操作,得到所述待强化对象对应的目标图片;所述第二处理操作为旋转、裁剪、形变和颜色抖动中的至少一种;
基于所述目标图片和所述待强化对象的测试样本集,得到所述待强化对象的强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练。
2.根据权利要求1所述的方法,其特征在于,各个所述待识别对象对应的测试样本集通过下述方式得到:
获取所述待识别对象的至少一个图片生成参数;
针对所述至少一个图片生成参数中的每一图片生成参数,生成与该图片生成参数对应的初始图片;
对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述待识别对象对应的测试样本集。
3.根据权利要求1所述的方法,其特征在于,所述测试样本集中还包括至少一个图片信息,每一图片信息对应唯一的测试图片,所述图片信息用于描述测试图片的内容信息;所述根据识别结果确定各个所述待识别对象的识别准确率,包括:
基于所述图片信息,确定出各个所述待识别对象的正确识别结果的总数,根据所述总数确定各个所述待识别对象的识别准确率。
4.根据权利要求1所述的方法,其特征在于,确定待强化对象的方法,还包括:
将至少一个识别准确率由低到高进行排序,将处于排序范围内的识别准确率所对应的待识别对象作为待强化对象。
5.根据权利要求2所述的方法,其特征在于,所述第一处理操作包括至少一个图片处理操作,所述对至少一个初始图片中的每一初始图片分别进行第一处理操作,得到所述测试样本集,包括:
针对所述至少一个图片处理操作中的每一图片处理操作,根据该图片处理操作的操作占比,从所述至少一个初始图片中确定出至少一个目标初始图片;使用该图片处理操作对所述至少一个目标初始图片分别进行处理,得到至少一个处理后的目标初始图片;
直至使用所述第一处理操作对所述至少一个初始图片完成所有操作后,得到所述测试样本集。
6.一种图片样本集生成装置,其特征在于,所述装置包括图片识别模型,所述装置包括:
测试样本集生成模块,用于获取票据的常用字符,组成对象集,针对所述对象集中的各个待识别对象,分别获取各个所述待识别对象的图片生成参数,生成与所述图片生成参数对应的初始图片,对所述初始图片进行第一处理操作,得到各个所述待识别对象对应的测试样本集;所述图片生成参数包括字体、字号、字符颜色和在图片中的位置;所述第一处理操作为背景添加操作、噪声添加操作、仿射变换和透视变化中的至少一种;
识别准确率确定模块,用于通过所述图片识别模型对各个所述待识别对象对应的测试样本集中的测试样本进行识别操作,根据识别结果确定各个所述待识别对象的识别准确率;
待强化对象确定模块,用于将识别准确率低于准确率阈值的待识别对象,作为待强化对象;
强化模块,用于对所述待强化对象的所述初始图片进行第二处理操作,得到所述待强化对象对应的目标图片,基于所述目标图片和所述待强化对象的测试样本集,得到所述待强化对象的强化样本集,以便使用所述强化样本集对所述图片识别模型进行训练;所述第二处理操作为旋转、裁剪、形变和颜色抖动中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电金信软件有限公司,未经中电金信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011510018.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:干细胞快速提取设备
- 下一篇:一种工业机器人定位避震装置及其避震方法





