[发明专利]一种对图像进行字符识别的方法和装置有效
| 申请号: | 201410549721.8 | 申请日: | 2014-10-16 |
| 公开(公告)号: | CN104361312B | 公开(公告)日: | 2017-11-14 |
| 发明(设计)人: | 李健;兰志才;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
| 代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
| 地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 进行 字符 识别 方法 装置 | ||
技术领域
本发明涉及字符识别领域,特别是涉及一种对图像进行字符识别的方法,以及,一种对图像进行字符识别的装置。
背景技术
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查字符载体,比如纸上的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程,包括图像的预处理、字符的二值化、版面分析、字符切割和字符识别几个步骤。
其中,图像的二值化是光学字符识别的重要步骤。图像二值化通常采用的方法是,针对待处理的图像计算一张阈值平面,然后根据阈值平面将图像中的各像素点进行二值分割。NiBlack方法是一种二值化阈值的计算方法,它以局部开窗口的方式为每个像素点计算一个阈值,能够较好地处理亮度不均匀的待处理图像。但是NiBlack方法所开的窗口大小是固定的,不能根据字符作自适应调整,处理后的图像噪点比较多。另外,NiBlack方法针对图像中的字符位置与背景位置的每个像素点都要计算阈值,所以耗时比较长。
综上所述,在光学字符识别中,现有的图像的二值化处理方法存在耗时长、噪点多以及不能自适应地在字符周围开小窗口进行处理的问题。
发明内容
本发明提供了一种对图像进行字符识别的方法和装置,以减少图像处理的噪点,提高图像处理的速度。
本发明提供了一种对图像进行字符识别的方法,包括:
从待处理图像找出目标字符的边缘轮廓;
在对所述目标字符进行二值化处理时,针对所述目标字符的边缘轮廓中的各个像素点,分别作为当前像素点,判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像;
若所述当前像素点属于所述目标字符,则针对所述当前像素点进行二值化处理;
对进行二值化处理的图像进行字符识别。
优选地,所述从待处理图像找出目标字符的边缘轮廓包括:
对待处理图像中包含的各个像素点,对相邻的两个像素点的像素值进行比较;
若相邻两个像素点的像素值的差值大于预设阀值,则将像素值较大的像素点所在位置作为所述目标字符的边缘轮廓。
优选地,所述从待处理图像找出目标字符的边缘轮廓还包括:
针对得到的边缘轮廓,做出所述边缘轮廓的水平外接矩形;
查找所述待处理图像中与所述水平外接矩形重合的部分以及与所述最小外界矩形距离2个像素以内的区域,将查找的区域合并入所述边缘轮廓。
优选地,所述判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像包括:
以所述当前像素点为中心,以预设边长确定一个正方形的阀值区域;
根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值;
将所述当前像素点的亮度与所述比较值进行比较,若所述当前像素点的亮度大于所述比较值,则所述当前像素点为属于所述目标字符的背景图像,若所述当前像素点的亮度不大于所述比较值,则所述当前像素点为属于所述目标字符。
优选地,所述根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值包括:
在所述阀值区域内计算每个像素点的梯度值,包括:计算所述像素点的左边像素点的亮度与右边像素点的亮度的第一绝对差值以及所述像素点的上边像素点的亮度与下边像素点的亮度的第二绝对差值,将所述第一绝对差值和所述第二绝对差值中最大的值作为所述梯度值;
计算所述阀值区域内所有像素点的梯度值的和;
计算所述阀值区域内各个像素点的亮度分别与所述梯度值的乘积的和,并除以所述梯度值的和,减去预设阀值的差作为所述比较值。
优选地,所述方法还包括:
计算所述目标字符的字符笔画的宽度作为所述预设边长,进一步包括:
对所述目标字符的边缘轮廓按照预设的方向进行扫描;
统计每次扫描出现的相邻轮廓之间的距离值,并将出现次数最多的距离值作为所述目标字符的字符笔画的宽度。
本发明还提供了一种对图像进行字符识别的装置,包括:
轮廓查找模块,用于从待处理图像找出目标字符的边缘轮廓;
像素点判断模块,用于在对所述目标字符进行二值化处理时,针对所述目标字符的边缘轮廓中的各个像素点,分别作为当前像素点,判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410549721.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软磁铁氧体磁芯烧结热循环装置
- 下一篇:热风循环利用烘干装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





