[发明专利]一种手写字符的识别方法有效
| 申请号: | 202011151366.0 | 申请日: | 2020-10-25 |
| 公开(公告)号: | CN112308058B | 公开(公告)日: | 2023-10-24 |
| 发明(设计)人: | 苗军;陈辰;卿来云;乔元华;段立娟 | 申请(专利权)人: | 北京信息科技大学 |
| 主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100085 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 手写 字符 识别 方法 | ||
本发明公开了一种手写字符的识别方法,包括步骤1)制作手写字符对应的标准图像;步骤2)搭建U型全卷积神经网络,初始化网络参数,以手写字符图像作为训练数据,以步骤1)制作的各字符标准图像作为期望输出训练网络;步骤3)搭建分类器,以步骤1)制作的各字符标准图像作为训练数据,训练分类器使之能够对标准图像准确分类;步骤4)级联U‑Net与分类器,完成对手写字符的识别。本发明提供的手写字符识别方法,先将手写体图像处理为易于识别的标准印刷体图像,随后分类器对标准印刷体图像进行分类,能够有效提高手写体识别的准确率。
技术领域
本发明属于计算机视觉领域,特别涉及一种手写字符的识别方法,主要用于光学字符识别。
背景技术
手写字符识别是计算机视觉领域的基础研究内容,主要任务是识别从纸、照片或触摸屏等媒介得到的文字信息。随着机器学习的发展,大多数的光学字符识别采用人工神经网络的方法,取得了较好的识别效果。但是相较于标准印刷体字符的识别,由于手写体字符因人而异并存在许多变化,因此难以被机器识别正确,有些甚至难以被人工识别正确。
为了提高对于手写字符的识别准确率,本发明提出先将复杂多变的手写体图像处理为易于识别的标准印刷体图像,随后利用简单的分类器对标准印刷体进行分类的识别方法。本发明利用U-Net的网络结构来实现将手写体图像处理为标准印刷体图像的操作,U-Net是由Ronneberger在2015年提出一种含有多个下采样与上采样操作的U型全卷积神经网络,通常用于图像的语义分割。分类器无需对大量的手写体图像进行学习,仅需要学习将标准印刷体正确分类即可,因此可以选取简单分类器,大大减少了分类器的模型复杂度,并且提高了分类器的识别速度。最后通过将U-Net与分类器级联的方式,实现对手写体图像的高效识别。
发明内容
本发明的目的是提供一种手写字符的识别方法,从而解决目前对于手写字符识别不够准确的问题。
为了实现上述目的,所采用的技术方法如下:
步骤1)、制作手写字符对应的印刷体标准图像。对于同一字符的不同手写体图像,制作对应字符的标准印刷体作为标准图像,随后对标准图像进行灰度化、二值化等操作,以便U-Net进行学习;
步骤2)、搭建U型全卷积神经网络,初始化网络参数,将步骤1)中制作的各字符标准图像作为期望输出训练U-Net,从而实现将同一字符的不同手写体图像输入U-Net,输出该字符的标准图像;
步骤3)、搭建一个简单的分类器,将步骤1)中制作的各字符的单张标准图像作为训练数据,训练该分类器,使其能够对标准图像准确分类;
步骤4)、将U-Net与分类器级联,原始图像输入U-Net后得到经过处理的标准图像,随后将其送入分类器得到分类结果。
本发明提供的手写字符识别方法,先将手写体图像处理为易于识别的标准印刷体图像,随后分类器对标准印刷体图像进行分类,能够有效提高手写体识别的准确率。
附图说明
图1为制作标准图像的示意图,即对于同一字符的不同手写体,制作标准印刷体作为对应字符的标准图像;
图2为U型全卷积神经网络结构的示意图;
图3为本发明对手写字符识别的流程示意图。
具体实施方式
为了使本领域的技术人员更好地理解本申请的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。应当理解,此处所描述的具体实施例仅用以解释本发明,并不限定本发明。
根据本发明的实施方案,手写体样本来源于MNIST数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011151366.0/2.html,转载请声明来源钻瓜专利网。





