[发明专利]一种基于局部协作表示分类的手写汉字识别方法在审
| 申请号: | 201910521515.9 | 申请日: | 2019-06-17 |
| 公开(公告)号: | CN110210582A | 公开(公告)日: | 2019-09-06 |
| 发明(设计)人: | 刘烜;黄洪琼 | 申请(专利权)人: | 上海海事大学 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68 |
| 代理公司: | 上海元好知识产权代理有限公司 31323 | 代理人: | 张静洁;徐雯琼 |
| 地址: | 201306 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 手写汉字 特征向量 残差 重构 字典 特征向量集 稀疏表示 协作 汉字库 求解 手写 向量 分类 算法时间复杂度 | ||
本发明提供一种基于局部协作表示分类的手写汉字识别方法,包含步骤:S1、选取手写汉字库,提取所述手写汉字库中所有手写汉字的特征向量并分类,建立特征向量集A;提取待识别手写汉字的特征向量y;S2、在每类特征向量中找出与y最相似的一个特征向量,建立字典D1;S3、求解y在D1中的协作稀疏表示向量通过求取y对D1的第一重构残差;根据所述第一重构残差选取特征向量集A中的N类特征向量建立字典D2;S4、求解y在D2中的协作稀疏表示向量通过求取y对D2的第二重构残差,根据所述第二重构残差判断y对应于A中特征向量类别,实现识别手写汉字。本发明缩小了识别手写汉字时所用字典的规模,在减少算法时间复杂度的同时也提高了识别精度。
技术领域
本发明涉及光学字符识别技术,特别涉及一种手写汉字的自动识别方法。
背景技术
OCR(光学字符识别Optical Character Recognition)是指利用电子设备(例如扫描仪或数码相机)获取纸上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。OCR技术广泛应用于录入和处理银行票据、文字资料、档案卷宗、文案等,可代替人的手工录入,节省大量人力。通常以最终识别率、识别速度作为评测OCR技术的重要依据。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。
手写汉字识别技术属于OCR领域。显然识别手写汉字要把识别手写英文难上很多。第一,英文字符的分类少,总共62个字符(26个英文字母的大小写再加十个阿拉伯数字),而中文总共50,000多汉字,常用的就有3000多;第二,相同的汉字有多种字体,不同字体的书写方式有较大区别;第三每个人的书写风格也各不相同,实际的书写效果不利于机器识别。因此在过去的几十年中人们采用了许多办法去改进识别的精确度和稳定性。
近年来,受压缩感知理论影响,人们将稀疏表示引入模式识别问题中,提出了稀疏表示分类算法(Sparse Representation-based Classification,SRC),如今该算法已广泛应用于图形的分类识别。在手写汉字识别过程中,有的学者在学习字典的同时进行分类器训练,然后用得到的分类器对图像稀疏编码进行分类。也有学者,在获得多个指定类字典的前提下,根据特征向量在不同类字典下的重构残差进行分类,取得了比较好的分类效果。但是现有技术中,通过稀疏表示分类器识别手写汉字时,由于字典规模过大,以及稀疏表示分类算法中求解最小化L1范数的计算量过大,而导致事件复杂度极高,从而影响了识别效率。
发明内容
本发明的目的是提供一种基于局部协作表示分类的手写汉字识别方法,在OCR过程中,通过从手写汉字库的特征向量集中提取部分特征向量构造字典,将待测手写汉字的特征向量对应到所构造字典的某类特征向量中,实现识别手写汉字。本发明的手写汉字识别方法能够降低计算复杂度,实现快速识别手写汉字,并提高识别的准确率。
为了达到上述目的,本发明提供一种基于局部协作表示分类的手写汉字识别方法,包含步骤:
S1、选取手写汉字库,提取所述手写汉字库中所有手写汉字的特征向量并分类,建立特征向量集A=[Ai]i∈[1,k];Ai为A中的第i类特征向量,m为Ai中每个特征向量的维数,ni为Ai中特征向量的个数,k为从手写汉字库中提取的特征向量类别总数;提取待识别手写汉字的特征向量y,其中y∈Rm;
S2、在每类特征向量中找出与y最相似的一个特征向量,构造字典D1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910521515.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手写文本识别方法及装置、电子设备
- 下一篇:一种产品信息交互方法以及系统





