[发明专利]一种手写数字识别方法、装置、电子设备和可读存储介质在审
申请号: | 201910754232.9 | 申请日: | 2019-08-15 |
公开(公告)号: | CN112396136A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 李鹏程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/08 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 数字 识别 方法 装置 电子设备 可读 存储 介质 | ||
本发明公开了一种手写数字识别方法、装置、电子设备以及可读存储介质。所述方法包括:获取手写数字图片的样本集;利用所述样本集对跨层连接受限玻尔兹曼机网络模型进行训练,所述跨层连接受限玻尔兹曼机网络模型包括一个输入层、一个或多个隐藏层以及一个输出层,所述跨层连接受限玻尔兹曼机网络模型还包括在不同层之间的跨层连接,并且所述跨层连接形成一个跨层连接矩阵;将待识别的图片输入所述跨层连接受限玻尔兹曼机网络模型;根据输出的向量获取识别的结果。该技术方案优化了受限玻尔兹曼机网络模型,大幅度地提高了分类识别的精度,且通过对样本数据的预处理以及对初步识别结果的再处理,进一步提高了对手写数字识别的速度和精度。
技术领域
本发明涉及机器学习领域,具体涉及一种手写数字识别方法、装置、电子设备和可读存储介质。
背景技术
模式识别技术在社会生活和科学研究的许多方面有着巨大的现实意义,己经在许多领域得到了广泛应用。手写数字识别是模式识别中的一个分支,在大数据时代,我们对数据的需求更大,像财务,金融,邮件分拣等方面,这些方面由于对数据的准确性要求较高,数据量处理量庞大,且数据手写的较多,所以迫切需要一个能够准确且高效的识别方式。虽然数字只有0~9十个数字,但是很多数字差别不是很大,再者因人而异,每人写法千差万别,增加了准确识别出手写数字的难度。
当前的应用于手写数字识别算法主要包括KNN算法和PCA算法,其中KNN算法运算过程复杂,计算量大,速度慢,而PCA算法在运算过程中部分特征信息丢失,不能完整地描述识别对象的局部特征,且错误率较高。因此,如何选择并优化现有的算法也是需要解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种手写数字识别方法、装置、电子设备和可读存储介质。
依据本发明的一个方面,提供了一种手写数字识别方法,所述方法包括:
获取手写数字图片的样本集;
利用所述样本集对跨层连接受限玻尔兹曼机网络模型进行训练,所述跨层连接受限玻尔兹曼机网络模型包括一个输入层、一个或多个隐藏层以及一个输出层,所述跨层连接受限玻尔兹曼机网络模型还包括在不同层间的跨层连接,所述跨层连接形成一个跨层连接矩阵;
将待识别的图片输入所述跨层连接受限玻尔兹曼机网络模型;
根据输出的向量获取识别的结果。
可选的,所述跨层连接矩阵的公式为:
式中,k为迭代次数,fij为跨层连接矩阵F中输入层的第i个神经元和输出层第j个神经元的连接权值,β为更新的学习率,yj为输出层第j个神经元的期望输出,oj为输出层第j个神经元的实际输出,hj为输出层的第j个神经元的输入信号。
可选的,所述获取手写数字图片的样本集包括:
对样本集中的图片执行如下的至少一种操作:旋转、缩放、水平方向上偏移、垂直方向上偏移、水平翻转、垂直翻转、裁剪。
可选的,所述获取手写数字图片的样本集包括:获取MNIST数据集作为样本集;
所述利用样本集对跨层连接受限玻尔兹曼机网络模型进行训练包括:采用TensorFlow提供的接口构建模型框架。
可选的,所述获取MNIST数据集作为样本集包括:
采用TensorFlow库的规范函数tf.nn.moments和/或
tf.nn.batch_normalization实现批量规范化所述数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754232.9/2.html,转载请声明来源钻瓜专利网。