[发明专利]基于卷积神经网络和编码的手写数字识别方法在审

专利信息
申请号: 202011279352.7 申请日: 2020-11-16
公开(公告)号: CN112508036A 公开(公告)日: 2021-03-16
发明(设计)人: 陆剑锋;陈作磊;俞韬;汪智文;顾建锦 申请(专利权)人: 杭州电子科技大学
主分类号: G06K9/46 分类号: G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 杨舟涛
地址: 310018*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 卷积 神经网络 编码 手写 数字 识别 方法
【说明书】:

发明涉及光学符号识别领域,特别是手写数字识别这一应用领域,提出了一种基于卷积神经网络和编码的手写数字识别方法。本发明基于卷积神经网络和编码的方法,通过训练手写数字集和其轮廓特征,训练获得网络模型,求得各分类的二进制编码,识别时比较待识别编码和码本的汉明距离得到预测结果。实验结果证明该方法可以较为准确的识别手写数字,在泛化能力上也有不错的表现。

技术领域

本发明涉及光学符号识别领域,特别是手写数字识别这一应用领域,提出了一种基于卷积神经网络和编码的方法,提高了手写数字识别率和识别效率。

背景技术

手写数字识别的研究问题是如何利用电子计算机自动地辨认人手写在纸张上的阿拉伯数字,隶属于光学符号识别技术的范畴。在手写识别应用的领域中,按照识别方式分为在线识别和脱机识别,最困难的是脱机手写字符的识别。到目前为止,在手写数字识别领域中,研究者们已经将其推向各种实际的应用实践中。在针对由阿拉伯数字和少量特殊符号组成的数据信息,比如:银行票据录入,财务发票录入,邮件分拣等应用场景中,处理此类的手写数字信息,手写数字识别技术起到了至关重要的作用,极大地提高了手写数字录入计算机的速度。因此,手写数字识别技术的发明对实际生成过程中有着重大意义,有着极大的社会经济效应。

在过去几十年的技术发展中,研究者们提出很多中针对手写数字识别的方法。这些传统的方法主要包括全局分析方法和结构分析方法两类。对于前者,主要主要使用模版匹配,数学变换等技术,常常与数学统计分类方法一起使用。对于后者,常常需要提取字符的结构特征,比如圆圈,弧,端点等。然而到目前为止,通过这些传统的方法,电子计算机自动识别手写数字的本领还无法与人类的识别能力相比。虽然阿拉伯数字识别的类别只有10类,类别数量小并且笔画简单,但根据一些实验,数字识别的准确率并不如印刷字体识别的准确率高。原因主要在于数字笔画简单,数字之间的形体相近,并且由于人们书写习惯和方式不同,某些手写数字之间很区别较小,很难做出一套兼容所有书写习惯并且拥有高识别率的手写数字识别系统。所以,在手写数字识别这一应用技术上,需要朝着更加综合更加新颖的研究方向发展。随着人工智能深度学习学科的发展,如何将人工神经网络应用到手写数字识别技术上成为了迫切需要解决的问题。

发明内容

鉴于上述问题,本发明提出了一种基于卷积神经网络和二进制编码的手写数字识别方法。

本发明具体采用的技术方案如下:

一种基于卷积神经网络和编码的手写数字识别方法,其步骤如下:

S1:获取手写体数字图像的训练数据,并对每张手写体数字图像进行轮廓信息提取,然后将每张手写体数字图像的原图和轮廓图进行通道相加,再经过归一化后得到双通道手写体数字图像数据集;

S2:构建用于从图像中识别手写体数字的卷积神经网络模型,所述卷积神经网络模型为七层结构,其中第一层到第七层依次为卷积层、池化层、卷积层、池化层、全连接层、全连接层和全连接层,且在第一层和第二层之间以及第三层和第四层之间分别加入一个SENet模块,用于建模通道之间的相互依赖关系;

S3:利用所述双通道手写体数字图像数据集,对所述卷积神经网络模型进行训练,得到手写体数字识别模型;

S4:将每张双通道手写体数字图像输入所述手写体数字识别模型中,获取模型中第六层全连接层中所有节点的参数以及该图像中手写体数字的标签;对于具有相同标签L的所有双通道手写体数字图像,计算所有图像对应的模型中第六层全连接层中所有节点的参数平均值,再转换为该标签L下的二进制码;所有手写体数字标签的二进制码构成码本;

S5:从待识别的手写体数字图片中提取轮廓信息,然后将该图片的原图和轮廓图进行通道相加,经过归一化后得到双通道手写体数字图片,输入所述手写体数字识别模型中获得模型中第六层全连接层中所有节点的参数,再转换为二进制码后计算与所述码本中所有二进制码的汉明距离,选择汉明距离最小的二进制码的标签作为识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011279352.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top