[发明专利]一种中文打印字符图像合成方法及装置在审
申请号: | 201710423248.2 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107274345A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 李宏宇 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T11/60 |
代理公司: | 上海东信专利商标事务所(普通合伙)31228 | 代理人: | 杨丹莉,李丹 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 打印 字符 图像 合成 方法 装置 | ||
技术领域
本发明涉及光学字符识别领域,尤其涉及一种打印字符图像合成方法及装置。
背景技术
证件和票据中的打印字符图像识别是光学字符识别(OCR)领域的一个分支,不同于手写体识别,它更侧重于识别出现在图像中的机器打印字符,是语言依赖的。
中文打印字符识别要比英文字符识别更加复杂,因为中文字符类别繁多,比如:在国家中文标准字符集国标GB2312中仅一类字和二类字就有6763种。
识别这么多种字符需要一个很好的深度学习模型,而训练一个好的深度神经网络模型(DNN)则需要大量的高质量训练样本,该样本要不仅能够覆盖每个中文字符,而且每个字符都能有上千种变化,并且能够体现出不同应用场景中的背景变化。
迄今为止没有任何公开的大型中文打印字符集,而为数千种中文字符手动设计生成不同训练样本也是不现实的。目前,中文字符集合扩展主要采用非线性变换的方式进行一些简单的预处理,还有一些是通过融入扭曲模型来生成字符变种。
然而,这些方法没有能够形成一套整体方案,尤其是无法适应各种应用需求变化。因此,亟需一种中文打印字符图像合成方法,该方法能方便快速地扩展生成中文打印字符及合成中文打印字符图像,并适应各种应用需求。
发明内容
本发明的目的之一是提供一种中文打印字符图像合成方法,该方法能方便快速地扩展生成中文打印字符及合成中文打印字符图像,并满足关于中文打印字符图像的各种应用需求。
根据上述目的,本发明提出了一种中文打印字符图像合成方法,其包括步骤:
S101:接收用户输入的字符需求或图像字符,生成相应的标准字符;
S102:接收用户输入的背景图像,生成相应的背景模板;
S103:接收用户输入的变换需求,根据所述变换需求对所述标准字符进行变换,以生成相应的字符扩展集;
S104:将字符扩展集中的扩展字符与背景模板合成,生成合成字符图像。
本发明所述的中文打印字符图像合成方法的提出是为了满足关于中文打印字符图像的各种应用需求。该应用需求可以包括为训练深度神经网络模型提供大量的高质量训练样本,通常该样本不仅能够覆盖每个中文字符,而且每个字符都能有上千种变化,并且能够体现出不同应用场景中的背景变化,从而使得可以基于经所述训练样本训练的深度神经网络模型有效识别类别繁多的中文字符。
本发明所述的中文打印字符图像合成方法根据用户提供的字符需求或图像字符、背景图像以及变换需求生成合成字符图像,其中:
步骤S101中:为了合成字符图像,首先需要生成标准字符。该步骤根据用户输入的字符需求或图像字符生成相应的标准字符。所述字符需求可以包括对字体的指定,可以根据所述字符需求通过字符库生成相应的标准字符。所述图像字符是以图像形式给出字符,可以对所述图像字符进行处理以生成相应的标准字符。
步骤S102中:为了模拟不同背景图像场景,该步骤根据用户输入的背景图像生成相应的背景模板,该背景模板用于步骤S104中字符图像的合成。
步骤S103中:为了模拟不同字符变形场景,该步骤根据用户输入的变换需求对所述标准字符进行变换,生成相应的字符扩展集,该字符扩展集中的扩展字符用于步骤S104中字符图像的合成。
步骤S104中:该步骤将字符扩展集中的扩展字符与背景模板合成,生成合成字符图像。由于所述扩展字符和背景模板分别模拟了不同背景图像场景和不同字符变形场景,因此所述合成字符图像模拟了不同背景图像和不同字符变形结合的场景,以该合成字符图像作为深度神经网络模型的训练样本不仅能够覆盖每个中文字符,而且每个字符都能有上千种变化,并且能够体现出不同应用场景中的背景变化,从而使得可以基于经所述训练样本训练的深度神经网络模型有效识别类别繁多的中文字符。
从以上可以看出,本发明所述方法能方便快速地扩展生成中文打印字符及合成中文打印字符图像,并且可以满足关于中文打印字符图像的各种应用需求。
本发明所述的中文打印字符图像合成方法中,S102和S103的顺序可以互换。
进一步地,本发明所述的中文打印字符图像合成方法中:
当用户输入的为图像字符时,步骤S101包括:从图像字符中切分和提取出图像中所含的字符,对该字符进行二值化处理和缩放变换后生成所述标准字符,再将所述标准字符保存为相应的标准字符图像;
当用户输入的为字符需求时,步骤S101包括:根据所述字符需求,自动生成对应的字符,对该字符进行二值化处理生成所述标准字符,再将所述标准字符保存为相应的标准字符图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710423248.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序