[发明专利]一种对图像进行字符识别的方法和装置有效
| 申请号: | 201410549721.8 | 申请日: | 2014-10-16 |
| 公开(公告)号: | CN104361312B | 公开(公告)日: | 2017-11-14 |
| 发明(设计)人: | 李健;兰志才;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声语音技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
| 代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
| 地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 进行 字符 识别 方法 装置 | ||
1.一种对图像进行字符识别的方法,其特征在于,包括:
从待处理图像找出目标字符的边缘轮廓;
在对所述目标字符进行二值化处理时,针对所述目标字符的边缘轮廓中的各个像素点,分别作为当前像素点,判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像;其中,所述判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像包括:
以所述当前像素点为中心,以预设边长确定一个正方形的阀值区域;
根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值;
将所述当前像素点的亮度与所述比较值进行比较,若所述当前像素点的亮度大于所述比较值,则所述当前像素点为属于所述目标字符的背景图像,若所述当前像素点的亮度不大于所述比较值,则所述当前像素点为属于所述目标字符;
其中,所述根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值包括:
在所述阀值区域内计算每个像素点的梯度值,包括:计算所述像素点的左边像素点的亮度与右边像素点的亮度的第一绝对差值以及所述像素点的上边像素点的亮度与下边像素点的亮度的第二绝对差值,将所述第一绝对差值和所述第二绝对差值中最大的值作为所述梯度值;
计算所述阀值区域内所有像素点的梯度值的和;
计算所述阀值区域内各个像素点的亮度分别与所述梯度值的乘积的和,并除以所述梯度值的和,减去预设阀值的差作为所述比较值;
若所述当前像素点属于所述目标字符,则针对所述当前像素点进行二值化处理;
对进行二值化处理的图像进行字符识别。
2.根据权利要求1所述的方法,其特征在于,所述从待处理图像找出目标字符的边缘轮廓包括:
对待处理图像中包含的各个像素点,对相邻的两个像素点的像素值进行比较;
若相邻两个像素点的像素值的差值大于预设阀值,则将像素值较大的像素点所在位置作为所述目标字符的边缘轮廓。
3.根据权利要求1所述的方法,其特征在于,所述从待处理图像找出目标字符的边缘轮廓还包括:
针对得到的边缘轮廓,做出所述边缘轮廓的水平外接矩形;
查找所述待处理图像中与所述水平外接矩形重合的部分以及与最小外界矩形距离2个像素以内的区域,将查找的区域合并入所述边缘轮廓。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
计算所述目标字符的字符笔画的宽度作为所述预设边长,进一步包括:
对所述目标字符的边缘轮廓按照预设的方向进行扫描;
统计每次扫描出现的相邻轮廓像素之间的距离值,并将出现次数最多的距离值作为所述目标字符的字符笔画的宽度。
5.一种对图像进行字符识别的装置,其特征在于,包括:
轮廓查找模块,用于从待处理图像找出目标字符的边缘轮廓;
像素点判断模块,用于在对所述目标字符进行二值化处理时,针对所述目标字符的边缘轮廓中的各个像素点,分别作为当前像素点,判断所述当前像素点属于所述目标字符还是属于所述目标字符的背景图像;所述像素点判断模块包括:
阀值区域确定子模块,用于以所述当前像素点为中心,以预设边长确定一个正方形的阀值区域;
比较值统计子模块,用于根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值;
亮度比较子模块,用于将所述当前像素点的亮度与所述比较值进行比较,若所述当前像素点的亮度大于所述比较值,则所述当前像素点为属于所述目标字符的背景图像,若所述当前像素点的亮度不大于所述比较值,则所述当前像素点为属于所述目标字符;
其中,所述根据所述阀值区域内所有像素点的亮度统计所述阀值区域内亮度的比较值包括:
在所述阀值区域内计算每个像素点的梯度值,包括:计算所述像素点的左边像素点的亮度与右边像素点的亮度的第一绝对差值以及所述像素点的上边像素点的亮度与下边像素点的亮度的第二绝对差值,将所述第一绝对差值和所述第二绝对差值中最大的值作为所述梯度值;
计算所述阀值区域内所有像素点的梯度值的和;
计算所述阀值区域内各个像素点的亮度分别与所述梯度值的乘积的和,并除以所述梯度值的和,减去预设阀值的差作为所述比较值;
二值化处理模块,用于针对属于所述目标字符的当前像素点进行二值化处理;
字符识别模块,用于对进行二值化处理的图像进行字符识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声语音技术有限公司,未经北京捷通华声语音技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410549721.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软磁铁氧体磁芯烧结热循环装置
- 下一篇:热风循环利用烘干装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





