[发明专利]一种基于DCGAN深度网络的汉字字库生成方法及装置有效
申请号: | 201810079205.1 | 申请日: | 2018-01-26 |
公开(公告)号: | CN108170649B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 叶武剑;徐佐腾;刘怡俊;翁韶伟;张子文 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06F40/126;G06K9/68 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于DCGAN深度网络的汉字字库生成方法及装置,用于解决由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。 | ||
搜索关键词: | 一种 基于 dcgan 深度 网络 汉字 字库 生成 方法 装置 | ||
S1、确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
S2、对标准字体样本字库和目标字体样本字库进行预处理,得到目标‑标准字体字符图片数据集;
S3、采用编码器‑解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
S4、利用目标‑标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
S5、获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
S6、依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
S7、将完整的目标字体字符图片转换为目标字体完整字库。
2.根据权利要求1所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S2具体包括:S21、将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
S22、对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
S23、将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标‑标准字体字符图片,并进行去空白处理,得到目标‑标准字体字符图片数据集。
3.根据权利要求2所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S4具体包括:S41、将目标‑标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
S42、将目标‑标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
S43、通过深度卷积对抗生成网络DCGAN的目标函数,得到目标‑标准字体字符图片的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标‑标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
4.根据权利要求3所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S43之后还包括:S431、获取转换后的目标字体字符图片和目标字体样本字符图片之间的L1距离;
S432、获取L1距离在目标‑标准字体字符图片的损失值之中的权重值λ;
S433、根据目标‑标准字体字符图片的损失值以及L1距离在目标‑标准字体字符图片的损失值之中的权重值λ,通过生成器的目标函数,得到生成器的损失值;
S44、返回步骤S41进行迭代训练,直至迭代的次数与预置迭代次数相同或目标‑标准字体字符图片的损失值低于第一预置损失值阈值并且生成器的损失值低于第二预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
5.根据权利要求1所述的基于DCGAN深度网络的汉字字库生成方法,其特征在于,步骤S7具体包括:S71、将每一张目标字体字符图片进行标准化编码处理,确定每一张目标字体字符在字库中的标准化编码;
S72、调用BMFont平台、预置配置文件以及预置批量处理脚本文件,将完整的目标字体字符图片转换为目标字体完整字库FNT文件。
6.一种基于DCGAN深度网络的汉字字库生成装置,其特征在于,包括:第一获取单元,用于确定标准字体和目标字体并获取字符对应的标准字体样本字库和目标字体样本字库;
第一预处理单元,用于对标准字体样本字库和目标字体样本字库进行预处理,得到目标‑标准字体字符图片数据集;
构建单元,用于采用编码器‑解码器架构作为生成器,二分类卷积神经网络作为判别器,构建深度卷积对抗生成网络DCGAN;
训练单元,用于利用目标‑标准字体字符图片数据集对深度卷积对抗生成网络DCGAN进行训练,得到训练后的深度卷积对抗生成网络DCGAN;
第二获取单元,用于获取标准字体完整字库,并将标准字体完整字库转换为完整的标准字体字符图片;
转换单元,用于依次将完整的标准字体字符图片输入至训练后的深度卷积对抗生成网络DCGAN的生成器中,由训练后的深度卷积对抗生成网络DCGAN的生成器输出对应的完整的目标字体字符图片;
字库生成单元,用于将完整的目标字体字符图片转换为目标字体完整字库。
7.根据权利要求6所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,第一预处理单元具体包括:转换子单元,用于将标准字体样本字库转换为标准字体样本字符图片,将目标字体样本字库转换为目标字体样本字符图片;
处理子单元,用于对标准字体样本字符图片和目标字体样本字符图片进行裁剪和去空白处理;
拼接子单元,用于将字符对应的目标字体样本字符图片与标准字体样本字符图片拼接成目标‑标准字体字符图片,并进行去空白处理,得到目标‑标准字体字符图片数据集。
8.根据权利要求7所述的基于DCGAN深度网络的汉字字库生成装置,其特征在于,训练单元具体包括:第一输入子单元,用于将目标‑标准字体字符图片中的标准字体样本字符部分图片输入至深度卷积对抗生成网络DCGAN的生成器中,得到深度卷积对抗生成网络DCGAN的生成器输出的转换后的目标字体字符图片;
判别子单元,用于将目标‑标准字体字符图片中对应的目标字体样本字符部分图片和转换后的目标字体字符图片输入至深度卷积对抗生成网络DCGAN的判别器中,得到判别器根据转换后的目标字体字符图片和目标字体样本字符图片之间的差异性输出的布尔变量;
第一计算子单元,用于通过深度卷积对抗生成网络DCGAN的目标函数,得到目标‑标准字体字符图片的损失值;
迭代子单元,用于跳转至第一输入子单元进行迭代训练,直至迭代的次数与预置迭代次数相同或目标‑标准字体字符图片的损失值低于第一预置损失值阈值,得到训练后的深度卷积对抗生成网络DCGAN。
9.根该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810079205.1/,转载请声明来源钻瓜专利网。