[发明专利]基于深层卷积神经网络的离线手写汉字体识别方法在审

专利信息
申请号: 201810485688.5 申请日: 2018-05-21
公开(公告)号: CN108764242A 公开(公告)日: 2018-11-06
发明(设计)人: 陆成刚;黄成斌 申请(专利权)人: 浙江工业大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06N3/04
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 卷积神经网络 汉字体 汉字 离线 手写 分割 图片 读取 输出结果 图像采集 归一化 图片组 读入 像素 放大 图像 压缩 统一
【权利要求书】:

1.一种基于深层卷积神经网络的离线手写汉字体识别方法,其特征在于,包括以下步骤:

1)对汉字图像采集以及读取;

2)对图像进行处理,过程如下:

2.1)首先要进行汉字分割,把图片中所有汉字分割成1张图片一个汉字;

2.2)接着对图片进行压缩或者放大,因为分割出来的图片可能无法满足识别的输入,因此需要将图片进行归一化,统一大小为64*64像素;

3)读入处理过之后的图片组,利用已经训练好的深层卷积神经网络识别,并输出结果;

所述深层卷积神经网络包含3个卷积层、3个池化层、1个全连接层以及1个softmax层,输入一个64*64像素且含有单一汉字的图片,经过卷积层1产生64个64*64的矩阵,经过池化层1后产生64个32*32的矩阵,经过卷积层2、池化层2、卷积层3、池化层3后产生256个8*8的矩阵,再经过全连接层产生1个1*1024的矩阵,最后经过softmax层输出属于各种类别汉字的概率。

2.如权利要求1所述的基于深层卷积神经网络的离线手写汉字体识别方法,其特征在于,所述步骤3)中,所述深层卷积神经网络中,在最后的输出种类做调整,因为在后面的训练数据库中包含3755个汉字种类,所以输出3755个汉字种类;

Softmax函数表达式如下:

其中,pi表示经过Softmax函数后,图片属于第i个类别的概率;M表示识别的种类数;

ReLU激活函数表达式为:

f(x)=max(x,0)

池化方式中的max-pooling指采用最大值池化,在进行卷积的过程中,在图像边界进行填充,填充值为0,当进行卷积操作时会考虑周围填充的图像像素。

3.如权利要求2所述的基于深层卷积神经网络的离线手写汉字体识别方法,其特征在于,利用中科院的CASIA手写中文库中的HWDB1.1离线数据集对网络结构进行检验。

4.如权利要求1~3之一所述的基于深层卷积神经网络的离线手写汉字体识别方法,其特征在于,所述方法还包括以下步骤:

4)用户的结果反馈,根据用户反馈若干识别错的汉字,采用人工识别,并加入到网络的训练集中对网络进行更新训练,训练完成后可以对网络参数进行更新并传入识别系统中,设定一个更新周期等方式进行更新。

5.如权利要求1~3之一所述的基于深层卷积神经网络的离线手写汉字体识别方法,其特征在于,所述步骤1)中,采用拍照技术进行汉字图像采集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810485688.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top