[发明专利]光学字符识别区域的定位方法、系统及其存储介质有效
申请号: | 202110280359.9 | 申请日: | 2021-03-16 |
公开(公告)号: | CN113095327B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 丁凡 | 申请(专利权)人: | 深圳市雄帝科技股份有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/14;G06V30/162;G06T7/11;G06T7/136;G06T7/187;G06T7/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学 字符 识别 区域 定位 方法 系统 及其 存储 介质 | ||
本发明涉及字符识别技术领域,具体涉及一种光学字符识别区域的定位方法、系统及其存储介质,其方法包括:获取原始图像并转换为灰度图像,再进行二值化处理得到原始二值图像;在图像中标记出连通域;获取连通域的高、宽参数;将灰度图像中的当前像素点进行自适应阈值计算,得到第一二值图像;再去除其图像中的噪声区域,得到第二二值图像;将第一二值图像分别进行积分和哈尔特征图计算得到梯度图;根据梯度图的梯度频率得到y轴定位区间;根据y轴定位区间确定目标区域,并对第二二值图像进行截取,对图像中的连通域的间距进行统计,根据连通域之间的间距确定x轴定位区间;本发明其能实现对定位区域的快速定位,提高字符识别的稳定性和准确率。
技术领域
本发明涉及字符识别技术领域,具体涉及一种光学字符识别区域的定位方法、一种光学字符识别区域的定位系统以及一种存储有上述方法的可读存储介质。
背景技术
随着信息技术的发展,人们在社会生活中常常会通过光学字符识别(OpticalCharacter Recognition,OCR),其是指利用电子设备采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术;因此,OCR技术是实现无纸化的计算机自动处理的关键技术之一,而衡量一个OCR系统性能好坏的主要指标包括:拒识率、误识率、识别速度等。
在OCR技术中,其中一个关键步骤是进行字符区域进行定位;而在现有的技术中,当纸质材料中存在复杂的背景干扰,现有的OCR识别方法不能满足快速定位分割OCR字符区域,导致OCR识别稳定性较差,字符识别的准确率较低。
发明内容
为克服上述缺陷,本发明的目的即在于提供一种能快速定位分割OCR字符区域的定位方法、定位系统以及存储有该定位方法的可读存储介质。
本发明的目的是通过以下技术方案来实现的:
本发明是一种光学字符识别区域的定位方法,其包括:
获取待识别的原始图像及其宽度参数,并对所述原始图像进行灰度转换得到灰度图像,然后对所述灰度图像进行二值化处理,得到原始二值图像;
在所述原始二值图像中,通过连通域标记算法标记出若干个连通域;并获取每个所述连通域的高、宽的属性参数;并通过对所有连通域的高、宽的属性参数进行统计,将出现频率最高的宽、高的属性参数定义为实际的宽、高和面积的属性参数;
利用自适应阈值二值化算法,将所述灰度图像中的当前像素点与邻域像素块的灰度值进行阈值计算,得到第一二值图像;
根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像;
将所述第一二值图像进行积分得到积分图,并根据实际的宽、高的属性参数确定哈尔特征值,再根据所述哈尔特征值对该积分图进行哈尔特征图计算得到梯度图;将所述梯度图进行二值化处理后,沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间;
根据y轴定位区间和所述原始图像的宽度参数确定目标区域,根据目标区域对所述第二二值图像进行截取,得到第三二值图像;在所述第三二值图像中对相邻的连通域之间的间距进行统计,并计算出其平均间距范围;根据连通域之间的间距和连通域的实际的宽属性参数,确定x轴起点和x轴终点,得到x轴定位区间。
在本发明中,所述沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间包括:
沿y轴坐标从小到大方向对其梯度频率进行遍历并判断其是否大于字符数量阈值,若大于阈值则将当前的y方向位置确定为y轴起点;并继续沿y轴方向判断其梯度频率是否大于字符数量阈值,若小于阈值,则将当前的y方向位置确定为y轴终点,得到y轴定位区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市雄帝科技股份有限公司,未经深圳市雄帝科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110280359.9/2.html,转载请声明来源钻瓜专利网。