[发明专利]手写数字图像识别分类方法在审
| 申请号: | 201910521269.7 | 申请日: | 2019-06-17 |
| 公开(公告)号: | CN110287839A | 公开(公告)日: | 2019-09-27 |
| 发明(设计)人: | 常敏;陈果 | 申请(专利权)人: | 上海理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐颖 |
| 地址: | 200093 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 强分类器 弱分类器 手写数字 图像识别 分类 预处理 弱分类器组合 分辨能力 分类识别 神经网络 数据分类 数据集中 随机选取 误判 准确率 算法 字体 优化 送入 改进 智能 检测 重复 | ||
本发明涉及一种手写数字图像识别分类方法,对数据集中随机选取数据进行预处理后送入BP神经网络进行训练,形成一个已经训练好的神经网络,将其称为一个弱分类器;重复训练得到数个弱分类器,利用改进的ADABOOST算法将数个弱分类器组合在一起,形成一个强分类器,最后将用强分类器对数据分类识别。本发明对于ADABOOST中的判别方式进行优化,使其结构更加合理、智能、优化,通过改进后的算法对手写数字进行分类识别,从而大大增强了其分辨能力,极大的降低由于人员经验不足与疏忽大意,以及字体模糊不清,难以识别所造成的分类失误,从而提高了检测的准确率,减少误判和漏判问题的发生。
技术领域
本发明涉及一种图像识别技术,特别涉及一种手写数字图像识别分类方法。
背景技术
手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。手写数字虽然只有10个种类,但很多情况下对识别的精度要求非常高,而且每个人都有不同的字迹,要做到准确地识别还是有一定难度的。况且在实际应用中,手写数字识别的精确度要求要比汉字严格的多,因为数字识别经常用在财务、金融等领域。
发明内容
本发明是针对手写数字识别的问题,提出了一种手写数字图像识别分类方法,作为辅助判读方法,避免由于人员经验不足与疏忽大意,以及字体模糊不清,难以识别造成的诊断失误,从而提高了检测的诊断率,减少误判和漏判问题的发生。
本发明的技术方案为:一种手写数字图像识别分类方法,具体包括如下步骤:
1)从数据集之中,随机选取数据中6万张图片作为训练集,训练集中包含0至9这10个手写数字图片各6千张,数据集中的图片图像大小为28*28;
2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像。再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;
3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,形成一个已经训练好的神经网络,将其称为一个弱分类器;然后再重新打乱数据顺序后带入神经网络中进行训练得到第二个弱分类器;同样方法得到数个弱分类器;
4)利用改进的ADABOOST算法将数个弱分类器组合在一起,形成一个强分类器,最后将用强分类器对数据分类识别。
所述步骤4)中ADABOOST算法改进方法如下:
4.1)对原有的ADABOOST算法的判决策略进行改进,原ADABOOST算法中的分类函数:
式中,y(x)表示由BP网络分类所得到的结果,x为所输入的图像数据,at表示预测训练权重,T为ADABOOST中所包含的BP网络个数,定义为:
式中,et为分布权值之和,定义为:
式中,Dt(i)为分布权值,分布权值初始化为1/m,m为训练数据组数;
4.2)将h(x)进行更改让其更加优化,更改如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海理工大学,未经上海理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521269.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驾车玩手机行为的监控方法与系统
- 下一篇:手写图像识别方法





