[发明专利]一种字符识别方法和装置有效
| 申请号: | 201510467750.4 | 申请日: | 2015-07-31 |
| 公开(公告)号: | CN106709490B | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 王红法 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 王仲凯 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 字符 识别 方法 装置 | ||
本发明公开了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性,本发明实施例提供的方法包括:对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种字符识别方法和装置。
背景技术
光学字符识别(英文全称:Optical Character Recognition,英文简称:OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印出来的字符图像,通过检测暗、亮的模式确定字符图像的特征,然后用字符识别方法将字符的特征翻译成计算机文字的过程,在OCR中,需要对文本资料进行扫描,得到图像文件,然后对图像文件进行分析处理,从而获取到文字及版面信息。
在OCR的处理过程中,特征是识别字符的关键信息,每个不同的字符都需要通过对应的特征来和其他字符进行区分,字符的特征描述也是OCR的最重要的关键因素之一,目前常见的字符特征有如下三种:
1、字符模板,即将样本字符图像存档,用测试字符图像直接与其进行比对。
2、字符轮廓,即将字符的轮廓信息提取出来,以此作为比对的依据。
3、纹理描述,通过采用一定的纹理描述方法,将字符图像转化为纹理特征,依次进行比对识别。
本发明的发明人在实现本发明的过程中发现,上述现有技术存至少存在如下技术问题:
1、识别准确率低,尤其对于中文等大字符集合,往往识别效率会降低。
2、鲁棒性偏低,测试字符往往有各种复杂的背景、光照、大小等干扰因素,现有技术很难有稳定的高效的识别效果。
发明内容
本发明实施例提供了一种字符的识别方法和装置,用于提高字符识别的准确率,以及保证字符识别的稳定性。
为解决上述技术问题,本发明实施例提供以下技术方案:
第一方面,本发明实施例提供一种字符的识别方法,包括:
对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;
对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;
对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;
将所述第二字符特征输入分类器,识别出与所述第一字符图像对应的字符结果。
第二方面,本发明实施例还提供一种字符的识别装置,包括:
图像缩放模块,用于对第一字符图像按照至少两个尺度分别进行缩放处理,得到至少两个尺度的第二字符图像;
多类型特征提取模块,用于对于每一种尺度的第二字符图像都提取到至少两种不同类型的特征,得到各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征;
字符特征处理模块,用于对所述各种尺度的第二字符图像对应的至少两种不同类型的第一字符特征进行融合处理以及降维处理,得到各种尺度的第二字符图像对应的第二字符特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510467750.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种字符识别的处理方法和装置
- 下一篇:电子证件防伪验证系统





