[发明专利]一种手写字符的识别方法有效
| 申请号: | 202011151366.0 | 申请日: | 2020-10-25 |
| 公开(公告)号: | CN112308058B | 公开(公告)日: | 2023-10-24 |
| 发明(设计)人: | 苗军;陈辰;卿来云;乔元华;段立娟 | 申请(专利权)人: | 北京信息科技大学 |
| 主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100085 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 手写 字符 识别 方法 | ||
1.一种手写字符的识别方法,包括:
步骤1)、制作手写字符对应的印刷体标准图像;
步骤2)、搭建U型全卷积神经网络,初始化网络参数;以手写字符图像作为训练数据,以步骤1)制作得到的各字符对应的印刷体标准图像作为网络的期望输出;
步骤3)、搭建分类器,并训练分类器使其能够准确分类步骤1)制作的各字符标准图像;
步骤4)、级联U-Net与分类器,完成对手写字符的识别。
2.根据权利要求1所述的一种手写字符的识别方法,其中所述的步骤1)中制作手写字符对应的印刷体标准图像,其特征在于,对制作的印刷体标准图像进行灰度化为单通道图像,随后将其二值化,最后处理其图像尺寸,使其与手写字符图像一致。
3.根据权利要求1所述的一种手写字符的识别方法,其中所述的步骤2)搭建U-Net网络结构,其特征在于:以U型全卷积神经网络作为基础网络结构,网络中上采样层与下采样层的数量一致,使得输入数据尺寸与输出数据尺寸一致,以手写字符图像作为训练数据,以步骤1)制作得到的印刷标准体作为网络的期望输出,损失函数采用二分类交叉熵,公式如下:
其中是模型预测样本是正例的概率,y是样本标签,如果样本属于正例,取值为1,否则取值为0。
4.根据权利要求1所述的一种手写字符的识别方法,其中所述的步骤3)搭建分类器,其特征在于:分类器对步骤1)制作得到的各字符的单张标准图像进行学习即可。
5.根据权利要求1所述的一种手写字符的识别方法,其中所述的步骤4)级联U-Net与分类器,其特征在于:U-Net和分类器均在步骤2)、步骤3)中训练完成,两者参数均不再变化,手写字符图像先经过U-Net处理为标准图像,随后分类器对标准图像进行分类,完成对手写字符的识别。
6.根据权利要求1所述的一种手写字符的识别方法,其特征在于:U型全卷积神经网络共包含13个卷积层,2个下采样层,2个上采样层,以及两次跨层连接。
除最后一个卷积层外,其余卷积核大小(Kernel Size)均为3×3,滑动步长为1,边缘填充为1,激活函数为ReLU,公式如下:
f(x)=max(0,x)
其中x为节点的输入值,f(x)为节点的输入经过激活函数之后的输出值。
卷积层与激活函数之间都加入批量归一化,公式如下:
其中x是卷积后的结果,μ和σ分别是数据的均值和方差,γ和β是两个可学习的参数,分别控制数据的缩放和平移。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011151366.0/1.html,转载请声明来源钻瓜专利网。





