[发明专利]一种基于卷积神经网络的汉字识别方法在审
申请号: | 201611009032.3 | 申请日: | 2016-11-16 |
公开(公告)号: | CN106650748A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 鲁统伟;缪少君;彭玲;刘仁军;吴梦露;张彦铎;李晓林;卢涛;闵锋;李迅;周华兵;朱锐 | 申请(专利权)人: | 武汉工程大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 湖北武汉永嘉专利代理有限公司42102 | 代理人: | 唐万荣 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络的汉字识别方法,该方法包括以下步骤1)采集训练用的文本图像;2)图像预处理首先对图像进行非均匀光照调整,然后将图像转换为灰度图像;3)对预处理的图像进行特征提取;4)通过训练获得最终识别模型,选取测试识别正确率最高的卷积神经网络模型,作为最终识别模型;5)文字识别对待识别的文本图像进行如步骤2)的图像预处理,采用训练所得的卷积神经网络模型进行识别,输出类别,匹配标签中汉字类别,输出汉字识别结果。本发明将提取方向特征图作为先验知识,和原始图像一起作为输入层的数据输入,以增强神经网络的识别性能,提高了汉字的识别率;且最终模型较小,计算速度快。 | ||
搜索关键词: | 一种 基于 卷积 神经网络 汉字 识别 方法 | ||
【主权项】:
一种基于卷积神经网络的汉字识别方法,其特征在于,包括以下步骤:1)采集训练用的文本图像;2)图像预处理:首先对图像进行非均匀光照调整,然后将图像转换为灰度图像3)对预处理的图像进行特征提取:采用Gabor滤波器提取图像八个方向的Gabor特征,八个方向分别是0°,22.5°,45°,67.5°,90°,112.5°,135°,157.5°;其中Gabor滤波器的公式如下所示:G1(x,y)=κ2σ2exp[-κ2(x2+y2)2σ2]]]>其中,σ=π,k=0,1,2,...,M‑1,M为方向数目,ι表示波长,θk表示方向;4)通过训练获得最终识别模型:将经过预处理的图像和经过Gabor特征提取的图像一起作为输入,输入卷积神经网络,所述卷积神经网络结构为包括两层卷积层和一层多卷积层的神经网络;选取测试识别正确率最高的卷积神经网络模型,作为最终识别模型;5)文字识别:对待识别的文本图像进行如步骤2)的图像预处理,采用训练所得的卷积神经网络模型进行识别,输出类别,匹配标签中汉字类别,输出汉字识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉工程大学,未经武汉工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611009032.3/,转载请声明来源钻瓜专利网。