[发明专利]一种图像处理方法、装置、设备以及存储介质在审
| 申请号: | 202210920303.X | 申请日: | 2022-08-02 |
| 公开(公告)号: | CN115359502A | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 杨文博;李深圳;孙磊磊 | 申请(专利权)人: | 北京如布科技有限公司 |
| 主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/413;G06V30/148;G06V30/146;G06N3/04 |
| 代理公司: | 北京云知万象专利代理事务所(普通合伙) 16013 | 代理人: | 何辉 |
| 地址: | 100038 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 处理 方法 装置 设备 以及 存储 介质 | ||
本发明公开了一种图像处理方法、装置、设备以及存储介质。该图像处理方法包括:获取待处理图像的多个文本区域;调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。采用本发明的技术方案,第一文本区域中的文本不少为弯曲文本,通过调整第一文本区域,得到水平的目标文本行,包括目标文本行的图像进行文本识别,可以提高文本识别率和识别准确度,计算量小、速度快、鲁棒性好以及实用性强。
技术领域
本发明涉及数字图像处理技术领域,尤其涉及一种图像处理方法、装置、设备以及存储介质。
背景技术
光学字符识别技术是指电子设备(比如:扫描仪)检查纸质文档上打印的文本,通过检测暗、亮的模式确定其形状,将纸质文档中的文本转换成为黑白点阵的图像文件,并通过识别软件将图像中的文本转换成可编辑的文本格式,供文本处理软件进一步编辑加工的技术。然而,该技术对于在同一水平线上的文本具有很好的识别效果;若待识别的图像是根据弯曲的文本或者不在同一水平线上的文本扫描得到的,容易导致识别的准确率不高。
目前,为保证光学字符识别算法能够获取到水平的文本往往需要固定的扫描台设备以及激光发生装置,不仅成本高,速度慢,而且可支持的场景单一;或者根据传统的图像处理算法,对图像进行二值化、计算连通域等操作使得与弯曲文本对应的图像在送入识别算法之后得到较好的识别率,其需要设置超参数、操作复杂,并且鲁棒性差。
发明内容
本发明提供了一种图像处理方法、装置、设备以及存储介质,矫正了包括弯曲文本的待处理图像,简单高效的提升图像的识别率。
根据本发明的第一方面,提供了一种图像处理方法,该方法包括:
获取待处理图像的多个文本区域;
调整与所述待处理图像的水平中线距离最近的第一文本区域,得到水平的目标文本行。
可选的,所述第一文本区域对应于所述待处理图像的水平中线的初始文本行。
进一步的,所述初始文本行,包括:
根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合;
根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中心点与所述第一水平线距离最近的第二集合;
根据经过所述第二集合内末端文本区域中心点的第二水平线,确定除第一集合以及第二集合之外的其他在竖直方向上相邻的集合的中心点与所述第二水平线距离最近的第三集合,得到包括所述第一集合、所述第二集合以及所述第三集合的初始文本行。
进一步的,所述根据水平方向上两个或两个以上相邻文本区域组成集合的横坐标,确定第一集合,包括:
将所述待处理图像中的多个文本区域依据同一水平方向以及相同的数量划分为两个或两个以上的集合,同一文本区域仅存在于单个集合之中;
根据各集合内首个文本区域的横坐标的数值对所述集合正序排列确定在先的集合序列;
判断所述集合序列中各集合的中心点到所述中线的距离最小的集合,得到所述第一集合。
进一步的,所述根据经过所述第一集合内末端文本区域中心点的第一水平线,确定除第一集合之外的其他在竖直方向上相邻的集合的中心点与所述第一水平线距离最近的第二集合,包括:
确定所述第一集合内末端文本区域中心点的第一坐标;
经过所述第一坐标对应的点作平行于所述水平中线的第一水平线,选择除第一集合之外的其他在竖直方向上相邻的集合的中心点到所述第一水平线距离最近的相邻集合作为所述第二集合。
可选的,合并在垂直方向上区分度极小的文本区域,得到所述初始文本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京如布科技有限公司,未经北京如布科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210920303.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





