[发明专利]一种书法字体类型与文字内容同步识别方法有效

专利信息
申请号: 201911334050.2 申请日: 2019-12-23
公开(公告)号: CN111104912B 公开(公告)日: 2021-11-23
发明(设计)人: 王俊平;张亚琼;方永强 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04
代理公司: 陕西电子工业专利中心 61205 代理人: 田文英;王品华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 书法 字体 类型 文字 内容 同步 识别 方法
【权利要求书】:

1.一种书法字体类型与文字内容同步识别方法,其特征在于,构建深度卷积神经网络,利用在线数据增强技术、深度迁移学习技术构建字体类型与文字内容同步识别网络,同步识别字体类型与文字内容,该方法包括以下步骤:

(1)生成训练集:

(1a)选取单个书法字图像至少2500张,其中,5种字体类型各选500张,每张为一个常用汉字;

(1b)将图像尺寸重置为103×103像素;

(1c)标注每张图像对应的字体类型和文字内容;

(1d)将标注后的2500张图像组成训练集;

(2)构建深度卷积神经网络:

(2a)搭建一个7层的深度卷积神经网络,其结构依次为:输入层→第一卷积层→第一最大池化层→第二卷积层→第二最大池化层→全连接层→输出层;

(2b)将输入层尺寸设置为103×103,将第一卷积层、第二卷积层的卷积核的大小分别设置为11×11、5×5,通道数分别设置为64、128,步长均设置为2,均采用不补零valid方式,均采用ReLU激活函数,将第一最大池化层、第二最大池化层的窗口大小分别设置为11×11、3×3,通道数分别设置为64、128,步长分别设置为2、1,将全连接层神经元个数设置为256,采用ReLU激活函数;

(2c)用于字体类型识别时,将深度卷积神经网络的输出层神经元个数设置为5,用于文字内容识别时,设置为500,均采用softmax激活函数;

(3)训练深度卷积神经网络:

(3a)选用交叉熵损失函数作为深度卷积神经网络的目标函数,动量因子设置为0.9,学习率设置为0.001;

(3b)将训练集按照每32张图像为1个批次进行划分,将每个批次的图像依次输入到深度卷积神经网络中,以每张图像对应的字体类型为标签,对输入的每个批次的图像进行在线数据增强后,使用带动量的随机梯度下降算法对深度卷积神经网络进行迭代训练,直至目标函数小于0.001时,得到训练好的用于字体类型识别的深度卷积神经网络;

(3c)将训练集按照字体类型划分为5个训练子集,将每个训练子集按照每32张图像为1个批次进行划分,分别将5个训练子集每个批次的图像依次输入到训练好的用于字体类型识别的深度卷积神经网络中,均以每张图像对应的文字内容为标签,对输入的每个批次的图像进行在线数据增强后,利用深度迁移学习技术,固定输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层的网络权重,使用带动量的随机梯度下降算法对深度卷积神经网络中的全连接层、输出层网络权重进行迭代训练,直至目标函数小于0.001时终止训练,得到5个训练好的用于文字内容识别的深度卷积神经网络;

(4)构建字体类型与文字内容同步识别网络:

将训练好的用于字体类型识别的深度卷积神经网络的第1至5层组成公共模块,将训练好的用于字体类型识别的深度卷积神经网络的第6至7层作为第1分支模块,将5个训练好的用于文字识别的深度卷积神经网络的第6至7层分别作为第2至6分支模块;将第1至6分支模块并联后再与公共模块进行串联,得到字体类型与文字内容同步识别网络;

(5)生成字体类型与文字内容同步识别向量:

(5a)将待识别的一张单个书法字图像输入到字体类型与文字内容同步识别网络中,经过公共模块输出128张17×17的特征图像;

(5b)将128张特征图像分别输入到6个分支模块,第1分支模块输出1个字体类型识别向量,第2至6分支模块每个分支模块输出1个文字内容识别向量,得到5个不同字体类型的文字识别向量;

(5c)将字体类型识别向量的字体类型概率分别与每个不同字体类型的文字识别向量相乘,将得到的5个字体类型与文字内容同步识别子向量拼接组成字体类型与文字内容同步识别向量;

(6)同步识别字体类型与文字内容:

(6a)将字体类型识别向量每个维度对应的字体类型依次进行编号后得到字体类型序列,将文字内容识别向量每个维度对应的文字内容依次进行编号后得到文字内容序列;

(6b)用字体类型与文字内容同步识别向量中最大值的维度索引除以500,将得到的商数作为字体类型索引,余数作为文字内容索引。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911334050.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top