[发明专利]图像处理方法、装置、设备和存储介质在审
申请号: | 202110788327.X | 申请日: | 2021-07-13 |
公开(公告)号: | CN113486828A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 徐青松;李青 | 申请(专利权)人: | 杭州睿胜软件有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06T7/136;G06K9/62;G06N3/04;G06N3/08;G06T7/13;G06T7/155;G06T7/187;G06T7/62;G06T3/40 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 罗莎 |
地址: | 310053 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 设备 存储 介质 | ||
一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。图像处理方法包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象。
技术领域
本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。
背景技术
随着数字化技术的发展,可以利用文本识别技术等对文本图像进行识别,以获取文本图像记载的信息,例如利用OCR(Optical Character Recognition,光学字符识别)识别技术,将图片、照片上的文字内容,直接转换为可编辑的文本。然而,目前的文字识别算法的复杂度高、计算量大,因而对使用环境存在限制,只适用于在服务器等硬件配置较高的设备上执行,而在终端设备等硬件配置较低的设备上执行时会导致识别速度很慢甚至不能识别的问题,因而在终端设备离线的情况下不易进行文字识别。
发明内容
本公开至少一个实施例提供一种图像处理方法,包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,M和N均为正整数。
例如,在本公开一实施例提供的图像处理方法中,利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用区域检测模型处理中间图像,得到包括多个初始对象连通区域的连通图像;对包括多个初始对象连通区域的连通图像进行形态学变换,以基于包括多个初始对象连通区域的连通图像得到包括M个对象连通区域的连通图像。
例如,在本公开一实施例提供的图像处理方法中,对初始图像进行处理以得到中间图像包括:将初始图像的尺寸由初始尺寸缩小至预定尺寸;对预定尺寸的初始图像进行二值化处理,得到中间图像。
例如,在本公开一实施例提供的图像处理方法中,确定在连通图像中与M个对象连通区域分别对应的M个包围框,包括:提取M个对象连通区域各自的轮廓信息;基于轮廓信息,确定M个对象连通区域各自的包围框。
例如,在本公开一实施例提供的图像处理方法中,基于M个包围框,从初始图像中截取N个图像块,包括:根据中间图像和初始图像之间的对应关系,基于M个包围框中的每个包围框,对应截取初始图像中的一个图像块,M与N相等;或者对M个包围框进行预定处理,得到N个处理后的包围框,并根据中间图像和初始图像之间的对应关系,基于每个处理后的包围框,对应截取初始图像中的一个图像块。
例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包括:对M个包围框进行评分,以得到M个包围框分别对应的质量分值;将质量分值小于分值阈值的包围框作为无效包围框,并删除无效包围框。
例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行评分包括:针对M个包围框中的每个包围框执行以下操作:确定包围框的面积和位于包围框中的目标对象对应的像素的面积;基于像素的面积与包围框的面积的比例,确定包围框对应的质量分值。
例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包括:将M个包围框中的一个或多个包围框放大第一预定倍数。
例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,还包括:检测M个包围框中每相邻两个包围框之间是否至少部分区域重叠,若是,将至少部分区域重叠的两个包围框中的每个包围框基于第二预定倍数进行缩小处理,以使得缩小后的两个包围框不重叠或者重叠区域减小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州睿胜软件有限公司,未经杭州睿胜软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110788327.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序