[发明专利]基于条件生成对抗网络的汉字字体生成方法在审
| 申请号: | 201810877295.9 | 申请日: | 2018-08-03 |
| 公开(公告)号: | CN109064522A | 公开(公告)日: | 2018-12-21 |
| 发明(设计)人: | 纪荣嵘;林贤明;李杰 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06T11/00 | 分类号: | G06T11/00;G06T7/13;G06F17/21 |
| 代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
| 地址: | 361005 *** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 汉字字体 基于条件 笔画 对抗 汉字 漂移 笔画粗细 笔画提取 笔画信息 粗细信息 方法提取 手写字体 网络生成 先验知识 训练过程 中心骨架 字体生成 相干 扩宽 网络 风格 | ||
基于条件生成对抗网络的汉字字体生成方法,涉及汉字字体生成。使用中心骨架提取及相干点漂移方法提取汉字位图的笔画信息;用条件对抗生成网络生成新风格的笔画。扩宽了连宙辉提取笔画方法,将笔画提取从无粗细信息的手写字体扩展到有笔画粗细信息的汉字位图;在字体生成上,提出的方法具有生成结果多样、训练过程简单、无需特殊先验知识、耗费人力时间少的优点。
技术领域
本发明涉及汉字字体生成,尤其是涉及基于条件生成对抗网络的汉字字体生成方法。
背景技术
对于中文来说,由于汉字字符数量多、笔画复杂,一套完整的字库通常需要包含GBK编码的两万多个汉字,这需要至少5到6人年的数量,因此设计一套新字库是一项艰巨的工程,由此也导致汉字的字库数量较少。
字体生成方面目前主要还是使用一些传统的方法。这些方法需要预先由专家建立模型,将汉字分成诸如部首、笔画等多个层级,依靠重新组合层级内部件,或者是用复杂的控制参数控制形状的特征,生成新的字体。字体生成一直是一个比较活跃的研究方向,汉字由于复杂的结构和众多的数量,汉字字体的生成相较于英文字体生成难度和复杂度都更高。
汉字生成模型可以分为基于笔迹的和基于图像的。基于笔迹模型方面的工作[1]主要是将汉字表示为一系列状态值,每个状态值包含了是起笔还是落笔,相对上一笔的坐标等信息,使用RNN来训练。这种方式可以生成较好的生成无宽度信息的字体,对于轮廓描述不够理想,不好表示字体风格,训练时间漫长。
基于图像的方法大多是将汉字拆分成笔画或者更多的层次,对笔画重新组合来生成新字体。连宙辉[2]提出通过拆分笔画,用两个只有一个隐含层的全连接人工神经网络来拟合参考字体到目标字体笔画相对位置及笔画形状的映射,达到用少量手写汉字来生成大量相同风格手写字体的效果。这种方法只适用于无宽度信息的手写字体,并且需要人为设定的地方较多。Alfred Zong提出的StrokeBank模型[3]将标准字体和目标字体分解成若干组件,采用方向线素特征和傅里叶谱作为描述子来生成StrokeBank.。生成时将对应字分解成组件,在StrokeBank中找最佳的映射集合得到对应组件,将组件重新组合起来得到对应的字体。这种方法并不生成新的笔画,而是使用之前分解出来的笔画。Songhua Xu[4]提出使用一个形状语法的衡量某个字Y来自字体X的似然概率。对要新生成的字,用现成的能生成字体的方法先生成它,加上一些能控制视觉效果的参数,利用梯度下降改变这些参数来提高来自目标字体的似然概率。这种方法需要字体方面的专业知识,对视觉效果参数的选取也不轻松。马小虎[5]提出的将曲线轮廓看作为一粒子以恒定速度做周期运动的路径,抽取出的笔画轮廓可以表示为时间t的周期函数,将周期函数表示成傅立叶级数的形式,通过对傅立叶级数加入随机噪声或者计算两个字体的傅立叶级数表示的插值得到新字体。使用无限多项级数来表示并不现实,通常只取前20至25项傅立叶级数作为字体的表示,这在某些时候会导致拟合结果不佳,特别是那些棱角比较分明的字体。
目前,对笔画的提取主要有三类方法:一类是直接从原本的汉字位图中提取,另一类是通过汉字轮廓提取,最后一类是对位图做细化后从细化得到的骨架上提取。
Ruini Cao[6]提出的方法可以作为直接从汉字位图上提取笔画的典型。这种方法需要对汉字上所有像素点,在多个方向上计算点到边界的距离PBOD(point-to-boundaryorientation distance)和边界到边界的距离BBOD(boundary-to-boundary orientationDistance),筛选出峰值,投影到三维空间里。寻找三维空间里的联通域,再投影回二维空间,每个联通域即为一个笔画。这种方法利用笔画宽度、方向等信息,但操作复杂,运算时间长,峰值等筛选的阈值对结果影响很大。另外,这种方法对类似“口”这样的结构无法正确划分。
程立[7]提出的基于轮廓的笔画抽取办法定义了五种的笔画交叉的情形,在找出轮廓上特殊的点(凹点)后,根据五种不同情形将凹点进行重新连接,达到分离笔画的目的。这种方法对比较工整的字效果很好,但对艺术化程度较高的字效果不佳。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810877295.9/2.html,转载请声明来源钻瓜专利网。





