[发明专利]图像校正方法、图像校正装置、计算机设备及存储介质在审
申请号: | 201911016421.2 | 申请日: | 2019-10-24 |
公开(公告)号: | CN111860527A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 汪昊 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06K9/36 | 分类号: | G06K9/36;G06K9/20;G06K9/34;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 校正 方法 装置 计算机 设备 存储 介质 | ||
本发明提出了一种图像校正方法、图像校正装置、计算机设备及存储介质。其中,图像校正方法包括:获取待校正图像,并获取待校正图像中的角点坐标;根据角点坐标和目标角点坐标,计算透视校正矩阵;利用透视校正矩阵对待校正图像进行透视变换,得到校正后的图像。采用本发明的技术方案能够解决相关技术中根据文字的倾斜方向计算证件的旋转角度出现的不准确和透视拍摄无法校正的问题,提高图像校正的精准性。
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像校正方法、图像校正装置、计算机设备及存储介质。
背景技术
证件OCR(Optical Character Recognition,光学字符识别)即自动识别出证件中的文字,要进行证件OCR,首先需要拍摄证件图片,然后对证件图片中的文字进行识别。由于拍摄者拍摄证件时,无法保证证件水平放置,可能会存在倾斜,甚至是倒立放置的情况。直接对这些非水平的证件进行识别,识别准确率低,甚至无法识别。
相关技术中的证件OCR方法,通常采用两种方法来解决证件摆放不正的问题:
1.证件拍摄时应用程序上显示一个证件区域框,拍摄者需要保证证件的边界与应用程序上的提示框准确对应,这样拍摄出来的证件就是水平状态。此方法对拍摄者要求较高,如果证件对齐不准确则无法正常拍摄,用户体验较差。
2.拍摄者可以随意拍摄,不对证件的摆放方向进行限制,由算法对证件进行校正。通常是根据文字的倾斜方向计算证件的旋转角度,但是会存在两个问题:(1)旋转角度计算不准确,导致校正不充分;(2)拍摄时手机与证件并不平行,存在透视问题,这种情况下,不能用单一的角度来描述证件的倾斜状态,进行校正必然不准确。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个方面在于提出了一种图像校正方法。
本发明的另一个方面在于提出了一种图像校正装置。
本发明的再一个方面在于提出了一种计算机设备。
本发明的又一个方面在于提出了一种计算机可读存储介质。
有鉴于此,根据本发明的一个方面,提出了一种图像校正方法,包括:获取待校正图像,并获取待校正图像的角点坐标;根据角点坐标和目标角点坐标,计算透视校正矩阵;利用透视校正矩阵对待校正图像进行透视变换,得到校正后的图像。
本发明提供的图像校正方法,获取待校正图像,该待校正图像即为非水平、倾斜的图像,利用模型(例如深度学习模型)获取待校正图像的四个角点坐标,根据角点坐标与目标角点坐标得到透视校正矩阵,目标角点坐标是期望的水平图像的角点坐标。进一步地,利用透视校正矩阵将待校正图像中的每个像素点数值映射为水平状态下对应像素点数值,也就是得到校正后的水平的图像。采用本发明的技术方案能够解决相关技术中根据文字的倾斜方向计算证件的旋转角度出现的不准确和透视拍摄无法校正的问题,提高图像校正的精准性。
需要说明的是,待校正图像是需要校正的证件或者名片的图像,可以直接为用户拍摄的图片,也可以是在用户拍摄的图片中提取得到。例如,在进行身份审核需要上传证件图像时,用户将摄像头直接对准证件拍摄,此时拍摄到的图片中仅有证件图像而不包含其它图像。或者,用户不将摄像头直接对准证件拍摄,拍摄到的图片中除了证件图像还包含其它图像(如,放置证件的桌面),此时需要在图片中提取出证件图像,也就是待校正图像。
根据本发明的上述图像校正方法,还可以具有以下技术特征:
在上述技术方案中,还包括:检测校正后的图像,获取文字区域;对文字区域进行光学字符识别,获取文字信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911016421.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种旋转顶升支腿
- 下一篇:车辆的LIDAR集成灯装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序