[发明专利]一种基于DCGAN深度网络的汉字字库生成方法及装置有效
申请号: | 201810079205.1 | 申请日: | 2018-01-26 |
公开(公告)号: | CN108170649B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 叶武剑;徐佐腾;刘怡俊;翁韶伟;张子文 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06F40/126;G06K9/68 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张春水;唐京桥 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 dcgan 深度 网络 汉字 字库 生成 方法 装置 | ||
本发明实施例公开了一种基于DCGAN深度网络的汉字字库生成方法及装置,用于解决由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
技术领域
本发明涉及计算机文字处理技术领域,尤其涉及一种基于DCGAN深度网络的汉字字库生成方法及装置。
背景技术
已有基于深度神经网络(DCNN),通过给定某种特定字体的一小组字母,生成相同样式的剩余字母。
例如,在论文1(Baluja S.Learning Typographic Style[J].arXiv:ComputerVision and Pattern Recognition,2016.)中,论述了一种基于深度神经网络(DCNN)的英文字体生成方法。通过将某种字体的“B、A、S、Q”四个字母输入到DCNN网络,能够生成出该种字体下的其余大写英文字母图片。该方法主要基于逐像素的L2损失,通过学习“B、A、S、Q”四个字母在各种不同字体下的线条、弧度、倾斜度等字体信息,训练得到一个能够提取英文字母字体信息的DCNN网络;当将一种未知字体的“B、A、S、Q”四个字母输入到训练完成的DCNN网络时,该网络能自动提取此种字体的线条、弧度、倾斜度等信息,并生成出该种字体下的其余大写英文字母图片。
例如,在论文2(Yang S,Liu J,Lian Z,et al.Awesome Typography:Statistics-Based Text Effects Transfer[J].arXiv:Computer Vision and Pattern Recognition,2016.)中,论述了一种基于统计学的艺术字生成方法,可将某一个艺术字的艺术效果如火焰,霓虹灯,特殊纹理等迁移到另外一个不同的字符上去。该方法是一种机器学习的方法,主要是构建了一个合成某一字符的笔画信息与另一字符的艺术效果信息的过程,其关键思想是基于特征距离分析和建模出高质量的文本效果的基本特征,并利用它们来指导合成过程。
论文1的方法中,利用DCNN作为字符图像生成网络,并用逐像素的L2损失来比较生成结果和目标结果两幅图像之间的差异,以此作为损失函数来训练生成网络。但众所周知,L2损失容易导致生成结果模糊不清。论文1的方法生成的特定字体的英文字符往往十分模糊,没有明确的边缘,虽能看出是属于某一种字体,但模糊的字符并不具备实用价值。此外,中华文明源远流长,中文字体独具魅力,我们希望能有一种生成中文字体字符的方法,既减轻字体设计师的工作压力,又能发扬光大古人的书法瑰宝。我们要有一套自己的中文字体字符生成方法。
论文2的方法中,基于统计学分析和建模,提出一种文字效果迁移的方法。可将复杂多彩的艺术字效果和简单的黑白字符进行结合,得到新的艺术字。这种方法虽然也能对汉字字符进行处理,但字符的艺术效果迁移与字体转换是不同的两个概念,艺术效果迁移是在三通道彩色空间的迁移,更看重整体的视觉效果;而字体转换是在单通道黑白空间的迁移,不仅看重整体的视觉效果,还要求笔画角度、折角、勾提等细节处的匹配。论文2的方法无法胜任字体转换任务。
字体设计是一项非常需要专业知识,且费时费力的工作。汉字常用字有六千多个,加上非常用字共有几万个,当要设计一种新字体时,就需要专业人员根据新字体的特点,逐一地为这两千多个汉字赋予新字体,设计新字形,并在最后制作出相应的文件格式供用户使用。然而,由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致了耗时耗力,浪费人力成本的技术问题。
发明内容
本发明提供了一种基于DCGAN深度网络的汉字字库生成方法及装置,解决了由于汉字字符结构本身具有一定的相似性,设计六千多个新字体汉字常用字和几万个非常用字必然包含着大量的重复劳动,导致的耗时耗力,浪费人力成本的技术问题。
本发明提供了一种基于DCGAN深度网络的汉字字库生成方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810079205.1/2.html,转载请声明来源钻瓜专利网。