[发明专利]文档图像的倾斜校正方法及装置在审
申请号: | 202210742965.2 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115100660A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 孙铁;周博 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06V30/146 | 分类号: | G06V30/146;G06V30/19;G06V30/41;G06V10/82;G06N3/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 倾斜 校正 方法 装置 | ||
本申请涉及图像校正技术领域,提供一种文档图像的倾斜校正方法及装置。所述方法包括:将获取到的文档图像输入训练好的分类模型,从分类模型的各预设倾斜角度中,确定文档图像对应的目标倾斜角度;根据目标倾斜角度,对文档图像进行校正,获取目标文档图像;其中,述分类模型由标记有预估倾斜角度的各图像样本进行训练后得到。本申请实施例提供的文档图像的倾斜校正方法,能够对任意方向的文档图像进行倾斜校正,提高文档图像的倾斜校正结果的准确性。
技术领域
本申请涉及图像校正技术领域,具体涉及一种文档图像的倾斜校正方法及装置。
背景技术
文献在电子化过程,例如扫描或拍摄等过程中,通常会由于人为等外界因素影响从而照成扫描或拍摄的文档与图像正边成一定角度,即倾斜现象,导致出现文字行倾斜的文档图像。当文档图像存在较严重的文字行倾斜时,则需要对文档图像进行倾斜校正,避免由于文字行的倾斜导致OCR识别结果准确率下降。
对于文档图像的倾斜校正,相关技术中,通常通过霍夫变换以及基于离散点求最小外接轮廓,以确定倾斜角度,从而根据倾斜角度完成倾斜校正。但这种方式受限于单一排版的倾斜文档图像,同时受限于轮廓或霍夫直线检测的高度不确定性以及阈值选择不定性,无法有效地实现任意方向的倾斜文档图像的文本行校正,进而可能导致文档图像校正后,其方向与实际情况不同,导致对文档图像的倾斜校正结果的偏差较大。
发明内容
本申请旨在至少解决相关技术中存在的技术问题之一。为此,本申请提出一种文档图像的倾斜校正方法,能够对任意方向的文档图像进行倾斜校正,提高文档图像的倾斜校正结果的准确性。
本申请还提出一种文档图像的倾斜校正装置。
本申请还提出一种电子设备。
本申请还提出一种计算机可读存储介质。
根据本申请第一方面实施例的文档图像的倾斜校正方法,包括:
将获取到的文档图像输入训练好的分类模型,从所述分类模型的各预设倾斜角度中,确定所述文档图像对应的目标倾斜角度;
根据所述目标倾斜角度,对所述文档图像进行校正,获取目标文档图像;
其中,所述述分类模型由标记有预估倾斜角度的各所述图像样本进行训练后得到。
本申请实施例提供的文档图像的倾斜校正方法,通过将文档图像输入由标记有预估倾斜角度的图像样本训练得到的分类模型中,以利用分类模型对文档图像进行倾斜角度的分类,确定文档图像对应的目标倾斜角度,并根据确定的目标目标倾斜角度对文档图像进行校正,从而将对文档图像的倾斜角度的检测转换为可通过训练好的分类模型解决的分类问题,进而利用由各种倾斜角度的图像样本训练得到的分类模型,便可实现对任意360度方向的文档图像进行倾斜校正,提高文档图像的倾斜校正结果的准确性。
根据本申请的一个实施例,还包括:
将各所述图像样本依次输入预构建的分类模型进行模型训练,每次输入所述图像样本后均根据所述分类模型输出的所述图像样本的预设倾斜角度,与所述图像样本的预估倾斜角度的角度差,调整所述分类模型的参数,直至任一所述图像样本对应的所述角度差满足预设条件,完成所述分类模型的训练。
根据本申请的一个实施例,还包括:
确定所述目标文档图像中存在多个文本行,获取各所述文本行的斜率;
根据各所述斜率,对所述目标文档图像进行旋转校正。
根据本申请的一个实施例,获取各所述文本行的斜率,包括:
从所述目标文档图像中,获取各所述文本行对应的各文本框;
根据所述文本框各顶点的二维坐标,确定对应的所述文本行的斜率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210742965.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序