[发明专利]一种手写数字识别方法、装置、电子设备和可读存储介质在审
| 申请号: | 201910754232.9 | 申请日: | 2019-08-15 | 
| 公开(公告)号: | CN112396136A | 公开(公告)日: | 2021-02-23 | 
| 发明(设计)人: | 李鹏程 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 | 
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/08 | 
| 代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 | 
| 地址: | 100080 北京市*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 手写 数字 识别 方法 装置 电子设备 可读 存储 介质 | ||
1.一种手写数字识别方法,其特征在于,所述方法包括:
获取手写数字图片的样本集;
利用所述样本集对跨层连接受限玻尔兹曼机网络模型进行训练,所述跨层连接受限玻尔兹曼机网络模型包括一个输入层、一个或多个隐藏层以及一个输出层,所述跨层连接受限玻尔兹曼机网络模型还包括在不同层间的跨层连接,所述跨层连接形成一个跨层连接矩阵;
将待识别的图片输入所述跨层连接受限玻尔兹曼机网络模型;
根据输出的向量获取识别的结果。
2.如权利要求1所述的方法,其特征在于,所述跨层连接矩阵的公式为:
式中,k为迭代次数,fij为跨层连接矩阵F中输入层的第i个神经元和输出层第j个神经元的连接权值,β为更新的学习率,yj为输出层第j个神经元的期望输出,oj为输出层第j个神经元的实际输出,hj为输出层的第j个神经元的输入信号。
3.如权利要求1所述的方法,其特征在于,所述获取手写数字图片的样本集包括:
对样本集中的图片执行如下的至少一种操作:旋转、缩放、水平方向上偏移、垂直方向上偏移、水平翻转、垂直翻转、裁剪。
4.如权利要求1所述的方法,其特征在于,所述获取手写数字图片的样本集包括:获取MNIST数据集作为样本集;
所述利用样本集对跨层连接受限玻尔兹曼机网络模型进行训练包括:采用TensorFlow提供的接口构建模型框架。
5.如权利要求4所述的方法,其特征在于,所述获取MNIST数据集作为样本集包括:
采用TensorFlow库的规范函数tf.nn.moments和/或
tf.nn.batch_normalization实现批量规范化所述数据集;
从所述数据集中获取目标数量的样本,归一化处理所述样本获得目标像素的灰度图片,并获得目标长度特征数组的样本张量;
所述采用TensorFlow提供的接口构建模型框架包括:构建mini-batch实现梯度下降。
6.如权利要求1所述的方法,其特征在于,所述方法包括:在所述输出层后设置一个softmax回归函数,其中样本数量为m,每个样本输入的特征为x(i),标签y类别为k,其中k=10,得到的训练集为{(x(1),y(1)),(x(2),y(2)),……,(x(m),y(m))},x(i)∈R(n+1),标签y(i)∈{1,2,……,k},针对输入x,假设针对各类别j的概率值为p(y=j|x),在函数输出k维向量的情况下,向量元素和为1,所述回归函数hθ(x(i))计算公式如下:
式中,θ1,θ2,θk∈R(n+1)为模型参数,P(y(i)=j|x(i);θj)为样本x(i)属于j类的概率,θ为全部模型参数,所述softmax回归函数中将x分类为类别j的概率为:
7.如权利要求6所述的方法,其特征在于,所述方法还包括:
在所述softmax回归函数后还设置一个交叉熵损失函数;
或,
在所述输出层设置一个tf.nn.softmax_cross_entropy_with_logits函数同时实现回归和交叉熵损失运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754232.9/1.html,转载请声明来源钻瓜专利网。





