[发明专利]一种手写字符的识别方法有效

申请号：	202011151366.0	申请日：	2020-10-25
公开（公告）号：	CN112308058B	公开（公告）日：	2023-10-24
发明（设计）人：	苗军;陈辰;卿来云;乔元华;段立娟	申请（专利权）人：	北京信息科技大学
主分类号：	G06V30/14	分类号：	G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/08
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100085 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种手写字符识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种手写字符的识别方法，包括步骤1)制作手写字符对应的标准图像；步骤2)搭建U型全卷积神经网络，初始化网络参数，以手写字符图像作为训练数据，以步骤1)制作的各字符标准图像作为期望输出训练网络；步骤3)搭建分类器，以步骤1)制作的各字符标准图像作为训练数据，训练分类器使之能够对标准图像准确分类；步骤4)级联U‑Net与分类器，完成对手写字符的识别。本发明提供的手写字符识别方法，先将手写体图像处理为易于识别的标准印刷体图像，随后分类器对标准印刷体图像进行分类，能够有效提高手写体识别的准确率。

技术领域

本发明属于计算机视觉领域，特别涉及一种手写字符的识别方法，主要用于光学字符识别。

背景技术

手写字符识别是计算机视觉领域的基础研究内容，主要任务是识别从纸、照片或触摸屏等媒介得到的文字信息。随着机器学习的发展，大多数的光学字符识别采用人工神经网络的方法，取得了较好的识别效果。但是相较于标准印刷体字符的识别，由于手写体字符因人而异并存在许多变化，因此难以被机器识别正确，有些甚至难以被人工识别正确。

为了提高对于手写字符的识别准确率，本发明提出先将复杂多变的手写体图像处理为易于识别的标准印刷体图像，随后利用简单的分类器对标准印刷体进行分类的识别方法。本发明利用U-Net的网络结构来实现将手写体图像处理为标准印刷体图像的操作，U-Net是由Ronneberger在2015年提出一种含有多个下采样与上采样操作的U型全卷积神经网络，通常用于图像的语义分割。分类器无需对大量的手写体图像进行学习，仅需要学习将标准印刷体正确分类即可，因此可以选取简单分类器，大大减少了分类器的模型复杂度，并且提高了分类器的识别速度。最后通过将U-Net与分类器级联的方式，实现对手写体图像的高效识别。

发明内容

本发明的目的是提供一种手写字符的识别方法，从而解决目前对于手写字符识别不够准确的问题。

为了实现上述目的，所采用的技术方法如下：

步骤1)、制作手写字符对应的印刷体标准图像。对于同一字符的不同手写体图像，制作对应字符的标准印刷体作为标准图像，随后对标准图像进行灰度化、二值化等操作，以便U-Net进行学习；

步骤2)、搭建U型全卷积神经网络，初始化网络参数，将步骤1)中制作的各字符标准图像作为期望输出训练U-Net，从而实现将同一字符的不同手写体图像输入U-Net，输出该字符的标准图像；

步骤3)、搭建一个简单的分类器，将步骤1)中制作的各字符的单张标准图像作为训练数据，训练该分类器，使其能够对标准图像准确分类；

步骤4)、将U-Net与分类器级联，原始图像输入U-Net后得到经过处理的标准图像，随后将其送入分类器得到分类结果。

本发明提供的手写字符识别方法，先将手写体图像处理为易于识别的标准印刷体图像，随后分类器对标准印刷体图像进行分类，能够有效提高手写体识别的准确率。

附图说明

图1为制作标准图像的示意图，即对于同一字符的不同手写体，制作标准印刷体作为对应字符的标准图像；

图2为U型全卷积神经网络结构的示意图；

图3为本发明对手写字符识别的流程示意图。