[发明专利]一种用于合成文字的方法、装置和存储介质在审
申请号: | 202011231751.6 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112489165A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 黄跃峰;易作天;董亮;霍斌;冯雷 | 申请(专利权)人: | 中科云谷科技有限公司;中联重科股份有限公司 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06N3/04;G06N3/08 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 201306 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 合成 文字 方法 装置 存储 介质 | ||
本发明公开了一种用于合成文字的方法、装置和存储介质。该方法包括:获取输入的内容图像范围和风格图像;根据内容图像范围随机生成文字图像;根据文字图像和风格图像生成初始化文字合成图像;通过卷积神经网络对初始化文字合成图像进行迭代以生成文字合成图像。通过该方法,可以使得文字合成后的图像与真实图像相似度较高并且合成文字应用范围较广。
技术领域
本发明涉及文字合成技术领域,具体地,涉及一种用于合成文字的方法、装置和存储介质。
背景技术
文字合成是指将文字图像合成到背景图像中。现有的文字合成方法是在背景图像中找到一个平坦的区域,将随机生成的文字图像写在平坦区域上;同时对背景图像和文字图像做一些数据增广。传统的文字识别方法对复杂的场景鲁棒性不够,精度受限;基于深度学习的文字识别又需要大规模训练样本,现实中无法获取如此规模的样本,同时大规模样本标注也耗时耗力。传统的文字识别采用的方法是,采用合成样本加少量真实样本的方法来训练网络,合成样本的质量决定模型的性能。但是,合成样本图像与真实图像相似度较低,因此,现有的文字合成后的图像与真实图像相似度低,并且合成文字具有局限性。
发明内容
本发明的目的是提供一种用于合成文字的方法、装置和存储介质,用以解决现有的文字合成后的图像与真实图像相似度低并且合成文字具有局限性的问题。
为了实现上述目的,本发明第一方面提供一种用于合成文字的方法,该方法包括:
获取输入的内容图像范围和风格图像;
根据内容图像范围随机生成文字图像;
根据文字图像和风格图像生成初始化文字合成图像;
通过卷积神经网络对初始化文字合成图像进行迭代以生成文字合成图像。
在本申请的实施方式中,内容图像范围包括文字范围和背景范围;根据内容图像范围随机生成文字图像包括:
根据文字范围随机生成文字;
根据背景范围随机生成背景;
将文字和背景结合以生成文字图像。
在本申请的实施方式中,文字范围包括物料编码范围、厂家编码范围、年份范围和序列号范围;
根据文字范围随机生成文字包括:
从物料编码范围中随机生成物料编码,从厂家编码范围中随机生成厂家编码、从年份范围中随机生成年份以及从序列号范围中随机生成序
列号;
将随机生成的物料编码、厂家编码、年份和序列号结合以生成文字。
在本申请的实施方式中,获取输入的内容图像范围和风格图像包括:获取输入的随机文字识别范围;
根据文字范围随机生成文字还包括:识别随机文字识别范围内的随机文字,并将随机文字确定为文字。
在本申请的实施方式中,背景范围包括背景的像素值范围;根据背景范围随机生成背景还包括:
根据像素值范围随机生成背景的像素值。
在本申请的实施方式中,该方法还包括:
建立存储有多个字符模板的字符模板库。
在本申请的实施方式中,将文字和背景结合以生成文字图像包括:
从字符模板库中提取与文字的每一个字符对应的一字符模板,以生成多个样本字符;
对多个样本字符分别进行位置调整;
将调整后的多个样本字符和背景结合以生成文字图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科云谷科技有限公司;中联重科股份有限公司,未经中科云谷科技有限公司;中联重科股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011231751.6/2.html,转载请声明来源钻瓜专利网。