[发明专利]基于分块编码与Transformer的中文字形字库自动生成方法及系统在审
| 申请号: | 202111635060.7 | 申请日: | 2021-12-29 |
| 公开(公告)号: | CN114332260A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 连宙辉;刘亦天 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T3/40;G06N3/08;G06N3/04;G06K9/62;G06V10/774 |
| 代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 分块 编码 transformer 中文 字形 字库 自动 生成 方法 系统 | ||
本发明公布了一种基于分块编码与Transformer的中文字形字库自动生成方法及系统,包括第一阶段模型和第二阶段模型;基于分块编码的字形图片编码方法和基于Transformer的少样本高质量字形图片生成方法;通过设计用于降低Transformer计算成本的分块编码,只需要少量用户图片作为参考,将字形图片编码为适用于Transformer生成的序列格式,再使用Transformer生成带有目标风格的高分辨率汉字字形图片,最后对字形图片进行矢量化,得到完整的中文字形和字库文件。采用本发明技术方案,只需要少量用户图片作为参考,能够生成用户指定风格的高分辨率的字形图片和中文字库。
技术领域
本发明涉及计算机图形处理技术和人工智能技术,尤其涉及一种基于分块编码与Transformer的中文字形字库自动生成方法及系统。
背景技术
随着现在越来越多的人寻求个性化字体,现有的商业字体库不能满足快速增长的需求。对于包含大量字符(例如中文)的书写系统,产生了很大的需求缺口。例如常用字符集GB2312中有6,763个汉字,而字符集GB18030-2005包含超过70,000个汉字,其中大部分字形结构复杂。中文字体库中包含的字符多,这使得设计新的中文字体非常耗时且成本高昂。此外,字体设计的质量在很大程度上取决于设计师的个人能力和经验。
近些年来,许多研究人员希望自动生成中文字库来解决这一问题。例如文献(Zhang Y,Zhang Y,Cai W.Separating style and content for generalized styletransfer[C]//Proceedings of the IEEE conference on computer vision andpattern recognition.2018:8447-8455.)记载的方法“EMD”使用十张目标字体的参考图片提取风格特征,同时使用另外十张其他字体的同一汉字图片提取内容特征,并结合风格与内容特征解码出目标字体的特定字形图片。
这类自动生成中文字库的方法需要使用大量目标字形图片训练调整模型参数,用户设计或书写字形图片以提供训练数据仍需较长时间。因此,一些方法尝试减少目标字体的参考图片数量。例如文献(Park S,Chun S,Cha J,et al.Few-shot font generationwith localized style representations and factorization[J].arXiv preprintarxiv:2009.11042,2020.)中记载的方法“LF-Font”与文献(Park S,Chun S,Cha J,etal.Multiple Heads are Better than One:Few-shot Font Generation with MultipleLocalized Experts[J].arXiv preprint arXiv:2104.00887,2021.)中记载的方法“MX-Font”利用不同汉字拥有相同部件的特点,将汉字显式或隐式的拆分成若干部件,通过复用部件特征从少量参考字形图片中提取更多的风格特征信息。
然而,减少参考图片数量不可避免地降低了目标风格字形图片的生成质量。现有方法大多只能生成较低分辨率字形图片(例如由模型“EMD”生成的图片长宽均为64像素,由模型“LF-Font”与“MX-Font”生成的图片长宽均为128像素)。低分辨率字形图片无法直接应用于实际场景,也不利于进一步字体矢量化工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111635060.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多维度约束的订单分配方法及系统
- 下一篇:一种汽车座舱的智能视觉监控系统
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





