[发明专利]图像处理方法、装置、介质和计算设备有效
申请号: | 201910374294.7 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110163205B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 王标;林辉;段亦涛 | 申请(专利权)人: | 网易有道信息技术(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 介质 计算 设备 | ||
本发明的实施方式提供了一种图像处理方法。该方法包括:提取待处理图像的图像特征,得到第一特征值矩阵;采用分类预测模型对所述第一特征值矩阵进行处理,确定所述待处理图像相对于多个预定角度类别中每个预定角度类别的预测置信度并生成预测置信度集,其中预定角度类别指示了偏移角度所在的角度区间;根据所述预测置信度集,确定所述待处理图像的偏移角度;以及根据所述偏移角度,旋转所述待处理图像。本发明的方法通过将图像的偏移角度确定问题转化为角度分类任务,可以有效降低计算复杂度,提高确定的偏移角度的准确性。此外,本发明的实施方式还提供了一种图像处理装置、介质和计算设备。
技术领域
本发明的实施方式涉及图像处理领域,更具体地,本发明的实施方式涉及一种图像处理方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在工作生活中,常常需要识别提取图像中的文字,以编辑提取得到的文字;或者,在对图像进行识别处理时,对图像中文字的识别也是必不可少的。
通常,在识别图像中的文字时,往往采用光学字符识别(optical CharacterRecognition,OCR)方法。但图像中文字的角度对OCR方法识别文字的准确率影响较大。通常,在文字处于水平角度的情况下,OCR方法识别文字的准确率最高。
其中,在用户拍摄的图像中,往往存在文字相对于水平方向具有一定偏移角度的情况。则为了提高OCR方法识别文字的准确率,往往需要在采用OCR方法进行文字识别之前对图像进行纠偏,以将图像中文字的偏移角度尽可能的调至0°。现有技术中,在对图像进行纠偏时,往往需要数学建模、畸变函数参数的修正、计算反向影射坐标及图像恢复等步骤,其中的每一步都需要用到复杂的算法。因此,在存在大量的待纠偏图像时,采用上述方法会使得图像纠偏任务的执行效率低下。
发明内容
因此在现有技术中,采用现有的对图像进行纠偏,使得图像中文字的偏移角度趋近于0°的方法存在计算复杂度高的问题。
为此,非常需要一种图像处理方法,能够在保证纠偏效果较好的前提下,降低图像纠偏的计算复杂度。
在本上下文中,本发明的实施方式期望能够将图像纠偏任务转化为偏移角度的分类任务,以根据角度分类结果确定的偏移角度对图像进行旋转,从而降低图像纠偏的计算复杂度。
本发明实施方式的第一方面中,提供了一种图像处理方法,包括:提取待处理图像的图像特征,得到第一特征值矩阵;采用分类预测模型对所述第一特征值矩阵进行处理,确定所述待处理图像相对于多个预定角度类别中每个预定角度类别的预测置信度并生成预测置信度集,其中预定角度类别指示了偏移角度所在的角度区间;根据所述预测置信度集,确定所述待处理图像的偏移角度;以及根据所述偏移角度,旋转所述待处理图像。
在本发明的一个实施例中,在提取所述待处理图像的图像特征之前,所述图像处理方法还包括:确定所述待处理图像的最大内切圆;根据所述最大内切圆,对所述待处理图像做掩码处理;以及对掩码处理后的待处理图像进行归一化,得到归一化的待处理图像。其中,所述第一特征值矩阵根据所述归一化的待处理图像提取得到。
在本发明的另一个实施例中,所述图像处理方法还包括:提取样本图像的图像特征,得到第二特征值矩阵,所述样本图像具有对应的实际置信度集;根据所述第二特征值矩阵,采用所述分类预测模型,得到与所述样本图像对应的预测置信度集;根据与所述样本图像对应的实际置信度集,以及与所述样本图像对应的预测置信度集,采用第一损失计算模型确定所述分类预测模型的分类损失值;以及根据所述分类损失值,采用反向传播算法优化所述分类预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910374294.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序