[发明专利]一种用于合成文字的方法、装置和存储介质在审

申请号：	202011231751.6	申请日：	2020-11-06
公开（公告）号：	CN112489165A	公开（公告）日：	2021-03-12
发明（设计）人：	黄跃峰;易作天;董亮;霍斌;冯雷	申请（专利权）人：	中科云谷科技有限公司;中联重科股份有限公司
主分类号：	G06T11/60	分类号：	G06T11/60;G06N3/04;G06N3/08
代理公司：	北京润平知识产权代理有限公司 11283	代理人：	肖冰滨;王晓晓
地址：	201306 上海市浦东***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于合成文字方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种用于合成文字的方法、装置和存储介质。该方法包括：获取输入的内容图像范围和风格图像；根据内容图像范围随机生成文字图像；根据文字图像和风格图像生成初始化文字合成图像；通过卷积神经网络对初始化文字合成图像进行迭代以生成文字合成图像。通过该方法，可以使得文字合成后的图像与真实图像相似度较高并且合成文字应用范围较广。

技术领域

本发明涉及文字合成技术领域，具体地，涉及一种用于合成文字的方法、装置和存储介质。

背景技术

文字合成是指将文字图像合成到背景图像中。现有的文字合成方法是在背景图像中找到一个平坦的区域，将随机生成的文字图像写在平坦区域上；同时对背景图像和文字图像做一些数据增广。传统的文字识别方法对复杂的场景鲁棒性不够，精度受限；基于深度学习的文字识别又需要大规模训练样本，现实中无法获取如此规模的样本，同时大规模样本标注也耗时耗力。传统的文字识别采用的方法是，采用合成样本加少量真实样本的方法来训练网络，合成样本的质量决定模型的性能。但是，合成样本图像与真实图像相似度较低，因此，现有的文字合成后的图像与真实图像相似度低，并且合成文字具有局限性。

发明内容

本发明的目的是提供一种用于合成文字的方法、装置和存储介质，用以解决现有的文字合成后的图像与真实图像相似度低并且合成文字具有局限性的问题。

为了实现上述目的，本发明第一方面提供一种用于合成文字的方法，该方法包括：

获取输入的内容图像范围和风格图像；

根据内容图像范围随机生成文字图像；

根据文字图像和风格图像生成初始化文字合成图像；

通过卷积神经网络对初始化文字合成图像进行迭代以生成文字合成图像。

在本申请的实施方式中，内容图像范围包括文字范围和背景范围；根据内容图像范围随机生成文字图像包括：

根据文字范围随机生成文字；

根据背景范围随机生成背景；

将文字和背景结合以生成文字图像。

在本申请的实施方式中，文字范围包括物料编码范围、厂家编码范围、年份范围和序列号范围；