[发明专利]基于图像扩展的OCR模型训练方法、系统及装置在审
申请号: | 202011302897.5 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112418297A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 马明宇 | 申请(专利权)人: | 北京云从科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06T5/00 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;王天骐 |
地址: | 102300 北京市门头沟区石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 扩展 ocr 模型 训练 方法 系统 装置 | ||
本发明属于图像处理技术领域,具体提供一种基于图像扩展的OCR模型训练方法、系统及装置。本发明旨在解决现有OCR模型定制化图像需求较大,图像的数据训练集的采样数量庞大的问题。为此目的,本发明通过根据图像样本的类型设定图像扩展所需的参数,再对每个真实图像样本的参数所对应的真实数据进行背景增强扩展和新字段生成扩展,以获得扩展数据,基于扩展数据构建对应的扩展图像样本,将扩展图像样本输入OCR模型进行模型训练,从而实现仅需极少数的采样图像即可训练好OCR识别模型进行字符识别。
技术领域
本发明涉及计算机视觉当中的图像处理技术领域,尤其涉及一种基于图像扩展的OCR模型训练方法、系统及装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)作为计算机视觉中一个重要的应用领域,由于其有监督网络的特性,需要大量的训练数据支撑才能取得良好的模型及其识别效果。因此,在OCR领域中,包含各种场景的庞大数据训练集对于得到一个良好的OCR模型至关重要。
但是同一版式所包含的场景复杂多样,并且训练数据由于保密性等各种原因,无法获取足够大量训练数据,也即无法获得很多采样,甚至很多时候仅有几张训练数据供参考。由于定制化需求较大,图像的数据训练集的采样数量庞大,每类版式单独生成数据会导致产品开发周期大大延长,开发成本增加导致落地困难。因此,在OCR领域,迫切需求一种可以根据少量采样的真实数据便能够获得合适的OCR数据训练集的方法,来实现OCR模型的训练。
发明内容
为了克服上述缺陷,提出了本发明,以解决或至少部分地解决如何基于少量采样自动生成符合需求的大数量的OCR模型训练使用的数据训练集的技术问题,以快速获取大量的仿真数据样本并加快不同板式需求的开发效率。本发明提供了一种基于图像扩展的OCR模型训练方法、系统及装置。
第一方面,提供一种基于图像扩展的OCR模型训练方法,包括:
根据图像样本的类型设定图像扩展所需的参数;
对每个真实图像样本的参数所对应的真实数据进行背景增强扩展和新字段生成扩展,以获得扩展数据;
基于所述扩展数据构建对应的扩展图像样本;
将所述扩展图像样本输入所述OCR模型进行模型训练。
在上述方法的优选技术方案中,所述方法还包括:在构建所述扩展图像样本之后,将所述扩展图像样本和所述真实图像样本进行合并,以生成仿真图像训练集;
将所述扩展图像样本输入所述OCR模型进行模型训练,具体包括:
将所述仿真图像训练集中的每个图像样本输入所述OCR模型进行模型训练。
在上述方法的优选技术方案中,所述方法还包括:在构建所述扩展图像样本之后,将所述扩展图像样本和所述真实图像样本进行合并,以生成仿真图像训练集;
将所述扩展图像样本输入所述OCR模型进行模型训练,具体包括:
将所述仿真图像训练集中的每个图像样本输入所述OCR模型进行模型训练。
在上述方法的优选技术方案中,所述参数包括图像参数和字段参数,所述图像参数包括图像的亮度、对比度、颜色,
所述“背景增强扩展”包括:为模拟反光、亮光、暗光、黑白图像中的一种或多种而对所述真实图像的亮度、对比度、颜色中的至少一个进行调整;
并且/或者,
所述“新字段生成扩展”包括:根据所述字段参数,对所述真实图像样本中的字段区域内的内容及相应的字段特征进行扩展。
在上述方法的优选技术方案中,所述图像参数还包括噪声扰动变化范围,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云从科技有限公司,未经北京云从科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011302897.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:双电机扭矩矢量系统、控制方法及汽车
- 下一篇:一种水泥加工用除尘设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序