[发明专利]一种快速手写体识别方法在审
申请号: | 201710308717.6 | 申请日: | 2017-05-04 |
公开(公告)号: | CN107133647A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 欧阳建权;胡谦磊;唐欢容 | 申请(专利权)人: | 湘潭大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/48;G06N3/08 |
代理公司: | 北京卓恒知识产权代理事务所(特殊普通合伙)11394 | 代理人: | 徐楼 |
地址: | 41110*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 手写体 识别 方法 | ||
技术领域
本发明涉及一种识别方法,特别涉及一种手写体识别方法;属于计算机视觉、图像处理、机器学习领域。
背景技术
手写体数字识别具有广泛的应用前景,如邮政编码、统计报表、银行票据等。另外,近年来神经网络以其强大的学习能力和非线性映射能力解决了许多传统难题。同时,随着大数据时代的到来和云计算的兴起,许多学者都成功地采用神经网络的方法解决了手写体数字识别问题,并取得了不错的成果。随着计算机计算能力的提高和分布式计算的兴起,越来越多的学者都在成功采用神经网络的方法解决了手写体数字识别问题,并取得了不错的成果。但许多神经网络方法的训练时间过长,不适用于实时的手写数字识别场景中。如公开于2016年10月12日的申请号为CN201610346450.5的中国专利公开了一种基于动态样本选择策略的BP神经网络手写体识别系统,其利用样本离决策边界的距离来动态选择样本,同时采用梯度下降算法优化网络权重,该方法虽能够取得较好的识别效果,但训练时间过长,不利于推广。而且对于模糊图像的识别不具有可靠性。为了减少训练时间,南洋理工大学黄广斌教授于2004年提出极限学习机(简称ELM)模型。
极限学习机,全称Extreme Learning Machine,简称ELM,由于其输入权值和隐层偏置是被随机赋予,无需迭代调整,所以它的网络训练速度远远超出其他分类器。同时因为没有采用梯度下降算法,因此避免了局部极小值问题。与CNN等深度学习模型相比,极限学习机的训练速度是它们的几十至几百倍。但是ELM的识别准确率依靠训练样本和待识别图像的清晰度,当训练样本或待识别图像的像素质量不高时,其分类的准确度将大幅降低。而梯度方向直方图特征提取方法能够较好的解决这一问题。
梯度方向直方图(Histogram of Oriented Gradient,简称HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。它对图像几何的和光学的形变都能保持很好的不变性。
发明内容
针对现有技术中基于动态样本选择策略的BP神经网络手写体识别系统训练时间过长,极限学习机的识别准确率过度依靠训练样本和待识别图像的清晰度等问题,为了达到快速识别手写体图像的目的,本发明结合HOG特征提取算法和极限学习机的优势,提出了一种快速的手写字体识别方法。本发明提出的方法在训练时间和识别准确度上能够达到一定平衡,而且对于图像拍摄不清晰、模糊等情况下也能够具有较高识别率。
根据本发明的实施方案,提供一种快速手写体识别方法。
一种快速手写体识别方法,该方法包括以下步骤:
1)对图像样本进行HOG特征处理:对图像样本进行HOG处理,收集HOG特征,将HOG特征组合为HOG特征矩阵;
2)设置极限学习机网络模型参数:以图像样本的HOG特征矩阵作为极限学习机的网络输入,设置极限学习机网络模型的激活函数、隐层节点个数,并进行网络的训练;
3)读取快速手写体的待识别图像,并将图像转化为灰度图;
4)识别图像:对快速手写体的待识别图像的灰度图进行HOG特征处理,获取待识别图像的HOG特征,将待识别图像的HOG特征作为极限学习机的的参数输入极限学习机,进行图像识别。
在本发明中,所述步骤1)具体为:
1.1)整个图像规范化:采用gamma校正法将图像样本的颜色空间进行标准化,获得标准化图像;
1.2)计算图像梯度:分别计算标准化图像样本中每一个像素点横坐标和纵坐标方向的梯度,并据此计算每个像素位置的梯度方向值;
1.3)对原始图像进行切分:将原始图像分为n个细胞单元cell,每个细胞单元cell的大小为m*m,将a*a个相邻的细胞单元cell组成为一个联通区间block,相邻的联通区间block有重叠overlap,构建每一个细胞单元cell的特征向量;其中:n≥4,n>m≥3,m>a≥2;
1.4)为每个细胞单元cell构建梯度方向直方图:采用b个二进制bin的直方图来统计图像样本像素的梯度信息,也就是将细胞单元cell的梯度方向360度分成b个方向块;对细胞单元cell内每个像素用梯度方向在直方图中进行加权投影,可以得到这个细胞单元cell的梯度方向直方图,梯度大小就是作为投影的权值;其中:b≥2;
1.5)构建每一个联通区间block梯度方向直方图:将一个联通区间block内多有的细胞单元cell的特征向量串联起来,获得联通区间block的HOG特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湘潭大学,未经湘潭大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710308717.6/2.html,转载请声明来源钻瓜专利网。