[发明专利]一种字符识别方法及装置在审
申请号: | 201710428002.4 | 申请日: | 2017-06-08 |
公开(公告)号: | CN109034149A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 胡旭华 | 申请(专利权)人: | 北京君正集成电路股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/68 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙) 11498 | 代理人: | 王加岭;杨静 |
地址: | 100094 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符识别 可信度 字符识别结果 字符分割 搜索 图片 | ||
本发明实施例提供了一种字符识别方法及装置,解决了现有技术中字符分割不准确导致的识别效果差的问题。该方法具体包括:接收待进行字符识别的图片;搜索图片中的字符可能存在区域,识别所述字符可能存在区域中的字符,并且确定出字符识别的可信度;调整所述字符可能存在区域的大小和位置,识别调整后的字符可能存在区域中的字符,并且确定出字符识别的可信度;根据每次字符识别的结果及对应的可信度,确定出最终的字符识别结果。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种字符识别方法及装置。
背景技术
随着机器学习技术在图像处理技术领域的应用,大幅提高了图像处理技术的应用效果。图像处理技术的一个重要内容是字符识别,通过对人工神经网络展开训练,能够对输入的字符图片达到较高的识别效果。
字符识别的一个重要的应用场景是车牌识别。由于目前的人工神经网络主要是对单一字符图片进行识别,因此需要对输入图片进行车牌定位校正后,把车牌图像中的7个字符分别一个个地分割提取出来,为后面字符识别提供输入。
车牌分割提取之后,即进入车牌识别流程,该流程主要负责对前面每一个分割结果,进行识别分类,输出该分割结果的语义。以上步骤要满足两个条件,首先,输入的分割结果应该是一个包含车牌字符的图像。然后,输出的语义结果应该是该分割结果对应的真实字符含义。然而,现有技术面临着如下问题,即分割结果可能存在误差,导致识别结果不准确。
例如,一些模糊字符的二值化效果较差,导致字符粘连无法被正分割;再是车牌矫正不理想的情况,在垂直投影直方图看来也是粘连情况十分严重,难以分割;最后有的分割结果存在切字现象。分割结果不准确时,字符识别器无法准确识别出该字符的语义。
针对以上技术问题,目前并没有相应的解决方案。
发明内容
本发明实施例提供了一种字符识别方法及装置,用以解决目前由于图像分割不准确,导致字符无法被正确识别的问题。
本发明实施例提供的具体方案如下:
第一方面,一种字符识别方法,包括:
接收待进行字符识别的图片;
搜索图片中的字符可能存在区域,识别所述字符可能存在区域中的字符,并且确定出字符识别的可信度;
调整所述字符可能存在区域的大小和位置,识别调整后的字符可能存在区域中的字符,并且确定出字符识别的可信度;
根据每次字符识别的结果及对应的可信度,确定出最终的字符识别结果。
结合第一方面,在第一种可能的实现方式中,调整所述字符可能存在区域的大小和位置,包括:
按照第一预设步长和第一扩展上限,将所述字符可能存在区域分别向左、向右扩展;和/或,
按照第二预设步长和第二扩展上限,将所述字符可能存在区域分别向上、向下扩展。
结合第一方面,在第二种可能的实现方式中,所述识别调整后的字符可能存在区域中的字符,并且确定出字符识别的可信度,包括:
将调整后的字符可能存在区域采用不同的阈值进行二值化处理;
分别对处理后的区域进行字符识别,并且确定出字符识别的可信度;
确定出可信度最高的字符识别结果及对应的可信度。
结合第一方面或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,该方法还包括:
每当识别出字符之后,判断字符特征是否满足预设条件;如果是,保留本次字符识别结果;
否则,放弃本次字符识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君正集成电路股份有限公司,未经北京君正集成电路股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710428002.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于文字图像识别音频阅读方法及其装置
- 下一篇:图像处理方法及装置