[发明专利]一种文字生成方法、装置、存储介质及电子设备有效
申请号: | 202110202832.1 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112949642B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 周高景;刘曦;张睿 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/34;G06K9/62;G06V10/774;G06V10/764;G06V10/80 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 生成 方法 装置 存储 介质 电子设备 | ||
本说明书公开了一种文字生成方法、装置、存储介质及电子设备,本说明书实施例将原始文字图像与指定文字图像输入预先训练的文字生成模型中,通过第一模型对原始文字图像中的文字区域进行预测,并根据预测的文字区域,对原始文字图像进行过滤,得到原始文字图像中文字的结构特征。然后,通过第二模型提取指定文字图像中文字的效果特征。最终,通过第三模型将结构特征与效果特征进行融合,生成目标文字图像。在此过程中,将原始文字图像中文字区域内的文字结构特征筛选出来,可以避免原始文字图像中其他特征对目标文字图像生成的影响,从而提高了目标文字图像的图像质量。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种文字生成方法、装置、存储介质及电子设备。
背景技术
如今,文字图像的应用十分广泛,如文字识别、文字编辑等。而文字图像的应用不同,对文字图像中文字样式的要求也不同。因此,生成指定文字样式的文字图像非常重要。
现有技术中,先根据指定文字样式的文字图像,对生成式对抗网络(GenerativeAdversarial Networks,GAN)进行训练,训练完成后,通过训练后的GAN生成指定文字样式的文字图像。
然而,GAN生成的文字图像普遍存在质量较差的问题。
发明内容
本说明书实施例提供一种文字生成方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。
本说明书实施例采用下述技术方案:
本说明书提供的一种文字生成方法,包括:
获取原始文字图像及指定文字图像;
将所述原始文字图像输入预先训练的文字生成模型中的第一模型,通过所述第一模型,对所述原始文字图像中的文字区域进行预测;根据预测的文字区域,对所述原始文字图像进行过滤,得到所述原始文字图像中文字的结构特征;将所述指定文字图像输入所述文字生成模型中的第二模型,通过所述第二模型,提取所述指定文字图像中文字的效果特征;
将所述结构特征与所述效果特征输入所述文字生成模型中的第三模型,通过所述第三模型,将所述结构特征与所述效果特征进行融合,生成目标文字图像。
可选地,所述文字生成模型为编解码模型结构;其中,所述第一模型和所述第二模型为编码器,所述第三模型为解码器。
可选地,所述第一模型包括:图像特征编码器和掩模编码器;
通过所述第一模型,对所述原始文字图像中的文字区域进行预测,具体包括:
通过所述图像特征编码器,提取所述原始文字图像的图像特征,所述图像特征包括:所述原始文字图像中文字的结构特征和所述原始文字图像的背景特征;
将所述图像特征输入所述掩模编码器,通过所述掩模编码器,对所述原始文字图像中的文字区域进行预测。
可选地,根据预测的文字区域,对所述原始文字图像进行过滤,得到所述原始文字图像中文字的结构特征,具体包括:
根据所述掩模编码器预测的文字区域,通过所述掩模编码器,生成相应的掩模矩阵;
通过所述掩模矩阵对所述图像特征进行过滤,得到所述原始文字图像中文字的结构特征。
可选地,预先训练所述文字生成模型,具体包括:
获取不同文字样式的样本文字图像;其中,所述文字样式包括:文字结构和文字效果;
针对任意两个样本文字图像,将其中一个样本文字图像作为原始样本文字图像,另一个样本文字图像作为指定样本文字图像,将所述原始样本文字图像输入所述第一模型,将所述指定样本文字图像输入所述第二模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110202832.1/2.html,转载请声明来源钻瓜专利网。