[发明专利]一种基于字体流形的中文字库自动生成方法有效
申请号: | 201810093715.4 | 申请日: | 2018-01-31 |
公开(公告)号: | CN108304357B | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 连宙辉;郭远;唐英敏;肖建国 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F40/109 | 分类号: | G06F40/109;G06K9/62;G06K9/68;G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 字体 流形 中文 字库 自动 生成 方法 | ||
本发明公布了一种中文字库自动生成方法,基于流形学习和深度神经网络,针对已有的汉字字库,提取字库的风格特征向量和字形特征向量,建立每个字的风格流形;再训练字体渲染网络,实现从特征向量到汉字图像的映射;在流形空间中获得新的特征向量,放入训练好的字体渲染网络,得到新风格的汉字字库。本发明不需人工书写汉字,无需人工干预;同时,流形空间的创建基于已有字体的特征向量,所以保证了新的特征向量不会出现巨大的偏差,保证了汉字原有的字形,风格特征的可解释性也较高。
技术领域
本发明属于计算机图形学和人工智能领域,涉及字库生成方法,尤其涉及一种能无需人工干预的中文字库自动生成方法。
背景技术
随着智能终端以及移动互联网的飞速发展,人们的日常生活中会接触到各种各样的字库。而这些字库,大多是由专业的字库设计团队,人工设计,逐字制作而成,耗费大量的人力物力,成本高昂。随着人工智能的兴起,字库制作中大量的重复性机械性工作,可借助计算机完成,从而大量节省字库制作的成本。
目前,国内的字体设计和制作技术还不够先进,现有的中文字库制作方法大多依赖于人工经验和设计,自动化程度很低,一般先由书法家书写或字体设计师制作几百到几千个基准字,包含目标字库所有汉字出现的全部笔画和部件,并将这些字形的边缘轮廓用曲线和直线来存储。然后,字体制作人员将基准字的笔画和部件进行加工修改,来生成完整的字库。最后,每个汉字字形还要经过精细的调整。大量的人工字形调整与设计造成字库制作技术自动化程序低,制作周期长,效率低下。
近些年来,大量的研究人员,希望借用人工智能技术,来辅助实现中文字库的设计。文献(Zhouhui Lian,Bo Zhao,and Jianguo Xiao.2016.Automatic generation oflargescale handwriting fonts via style learning.In Proc.SIGGRAPH ASIA2016TB.ACM,12.)使用人工神经网络的方法,对汉字的书写风格建模,从而生成中文字库。但该方法需要事先由用户书写若干汉字,对已经书写的汉字建模。在已有的汉字较少的情况下,建模的效果不甚理想。文献(Yue Jiang,Zhouhui Lian,Yingmin Tang,JianguoXiao.2017.DCFont:An End-To-End Deep Chinese Font Generation System.InProc.SIGGRAPH ASIA 2017TB)对上一种方法进行了改进,在风格建模部分使用了深度神经网络,有了更好的建模效果。但该方法依然需要用户事先书写或设计若干汉字,且建模效果与数量成正比。因此,现有采用人工智能技术的字体生成方法仍需要借助人工设计/书写较大数量的汉字,无法实现自动化生成字体。
发明内容
为了克服上述方法中存在的问题,本发明提出了一种基于流形学习和深度神经网络的中文字库生成方法。本发明不需要用户事先书写/设计新字库的汉字,能实现完全自动生成包含所有汉字的完整的中文字库。
本发明从已有的汉字字库入手,提取每个字库的风格特征向量和字形特征向量,建立每个汉字的风格流形,每个已有的字体对应流形空间中的一个点。再训练一个字体渲染网络,实现从特征向量到汉字图像的映射。通过在流形空间中遍历或插值,可获得新的特征向量,将其放入字体渲染网络,即可得到新风格的汉字字库。
本发明采用的技术方案如下:
一种中文字库自动生成方法,基于流形学习和深度神经网络,针对已有的汉字字库,提取字库的风格特征向量和字形特征向量,建立每个字的风格流形;再训练字体渲染网络,实现从特征向量到汉字图像的映射;通过在流形空间中遍历或插值,获得新的特征向量,将其放入字体渲染网络,得到包含所有汉字的新风格的汉字字库;主要包含以下步骤:
第一步,收集已有字库,提取其风格特征向量和字形特征向量;
第二步,将提取到的风格特征向量和字形特征向量,用降维方法降维,建立流形空间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810093715.4/2.html,转载请声明来源钻瓜专利网。