[发明专利]字库字面的调整方法、装置、设备和存储介质有效

专利信息
申请号: 201911376768.8 申请日: 2019-12-27
公开(公告)号: CN111144066B 公开(公告)日: 2022-02-18
发明(设计)人: 刘成东 申请(专利权)人: 北大方正集团有限公司;北京北大方正电子有限公司
主分类号: G06F40/109 分类号: G06F40/109;G06T3/40;G06N3/04;G06N3/08
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 马少华;刘芳
地址: 100871 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字库 字面 调整 方法 装置 设备 存储 介质
【权利要求书】:

1.一种字库字面的调整方法,其特征在于,包括:

获取待调整字库中各个原始字符的字符图像;

确定各个原始字符的字符图像的核心区域图像;

基于各个原始字符的所述字符图像以及所述核心区域图像,通过单字符调整模型对各个原始字符的字面进行调整,其中,所述单字符调整模型为神经网络模型;

确定各个原始字符的第一平均尺寸,以及各个中间字符的第二平均尺寸,其中,所述中间字符为通过所述单字符调整模型对所述原始字符的字面进行调整之后得到的字符;

基于所述第一平均尺寸与所述第二平均尺寸确定所述中间字符的相对缩放比例;

基于所述相对缩放比例对所述中间字符进行缩放处理;

所述通过单字符调整模型对各个原始字符的字面进行调整,包括:

确定各个原始字符的所述核心区域图像的归一化缩放比例;

基于所述归一化缩放比例,对各个原始字符的所述字符图像以及所述核心区域图像进行归一化处理,得到各个原始字符的归一化图像以及归一化核心区域图像;

基于各个原始字符的所述归一化图像以及所述归一化核心区域图像,通过单字符调整模型对各个原始字符的字面进行调整;

所述基于各个原始字符的所述归一化图像以及所述归一化核心区域图像,通过单字符调整模型对各个原始字符的字面进行调整,包括:

基于各个原始字符的所述归一化图像以及所述归一化核心区域图像,通过单字符调整模型确定各个原始字符的单字符缩放比例;

基于所述单字符缩放比例对所述原始字符的字面进行缩放处理;

基于所述归一化缩放比例、所述单字符缩放比例以及所述相对缩放比例,对所述待调整字库中各个原始字符的字形进行缩放处理;

将调整之后的结果写入所述待调整字库的字库文件。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取样本字库的多个样本字符的字符图像;

确定各个样本字符的字符图像的所述核心区域图像以及对应的所述单字符缩放比例的标注值;

基于各个样本字符的字符图像、对应的所述核心区域图像以及所述单字符缩放比例的标注值生成训练样本集;

基于所述训练样本集对所述单字符调整模型进行训练。

3.根据权利要求2所述的方法,其特征在于,所述基于所述训练样本集对所述单字符调整模型进行训练,包括:

基于字面调整模型确定所述训练样本集中的所述样本字符的所述单字符缩放比例的预测值;

基于所述单字符缩放比例的所述预测值与所述标注值确定所述字面调整模型的损失函数;

基于所述损失函数对所述单字符调整模型的参数进行调整。

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

对所述样本字库的样本字符的字符图像进行增广处理,生成多个增广样本字符。

5.根据权利要求1所述的方法,其特征在于,所述获取待调整字库中各个原始字符的字符图像,包括:

解析所述待调整字库的字库文件,确定所述字库文件包含的字符编码信息;

根据所述字符编码信息,将所述待调整字库的各个原始字符渲染为字符图像。

6.根据权利要求1所述的方法,其特征在于,所述确定各个原始字符的字符图像的核心区域图像,包括:

根据各个原始字符的字符图像的像素分布,确定各个字符图像的核心区域,所述核心区域为像素数量占所述字符图像的总像素数量的比例大于预定阈值的区域;

将所述核心区域的图像作为所述原始字符的字符图像的核心区域图像。

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述神经网络模型为深度神经网络模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京北大方正电子有限公司,未经北大方正集团有限公司;北京北大方正电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911376768.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top