[发明专利]基于卷积神经网络和随机森林的手写数字识别方法在审
| 申请号: | 201710131513.X | 申请日: | 2017-03-07 |
| 公开(公告)号: | CN106991374A | 公开(公告)日: | 2017-07-28 |
| 发明(设计)人: | 丁世飞;侯艳路;张楠;张健;赵星宇;曾凯 | 申请(专利权)人: | 中国矿业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 221116 江苏省徐*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 随机 森林 手写 数字 识别 方法 | ||
1.一种基于卷积神经网络和随机森林的手写体数字识别方法,其特征在于,包括以下步骤:
步骤1:采集手写数字图像生成训练集和测试集;
步骤2:构造并初始化卷积神经网络:该网络包括:输入层、两个卷积层、两个降采样层和一个全连接层,随机初始化卷积神经网络的权值,将样本输入到网络中,经过逐层计算得到样本的特征。
步骤3:训练随机森林分类器,利用bootstrap重抽样方法从样本中抽取多个样本,然后对每个bootstrap样本进行决策树建模,然后组成多棵决策树进行预测,最终投票得出预测结果;
步骤4:手写数字的识别,从卷积神经网络中得到特征数据之后,将特征数据输入到训练好的随机森林分类器中从而得到手写数字识别结果。
2.根据权利要求1所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤1中采集数字图像生成训练集和测试集,都为(X,Y)形式,其中X为数字图像的输入向量,Y为标签。
3.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤2具体为:积神经网络的输入为28*28的灰度图,卷积层C1卷积核大小为5*5,有10张特征图,降采样层S2有10张特征图,卷积层C3由S2的10张特征图经卷积而后得到20张特征图,因为特征图的数量较少,为了得到更全面的特征,组合方式采用全连接的方式,降采样层S4有20张特征图,全连接层将S4的20张特征图排列,设置500个节点;随机初始化卷积神经网络的权值,将样本输入到网络中,经过逐层计算得到样本的特征。
4.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤3具体为:训练随机森林分类器,具体包括:
1、从样本集中用bootstrap采样选出n个样本;
2、所有属性中随机选择k个属性,选择最佳分裂属性作为节点建立CART决策树,其中最佳分裂指数是根据gini指数来选择的:假设集合T中包含N个类别的记录,其中gini指数就是根据式来计算的,其中pj代表类j出现的概率,如果集合T分成m部分N1,N2,…,Nm。那么这个分裂的gini系数就是
对于所有的属性都要遍历所有可能的分裂方式,然后选择具有最小指数的分裂作为分裂标准。然后每棵树任意生长,不进行剪枝;
3、重复以上两步m次,即建立了m棵CART决策树,这m棵CART决策树形成随机森林,通过投票表决结果,决定数据属于哪一类。
5.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤4具体为:将卷积神经网络提取得到的测试特征数据输入训练好的随机森林分类器,最终得到测试结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710131513.X/1.html,转载请声明来源钻瓜专利网。





