[发明专利]图像处理方法、装置、设备和存储介质在审

专利信息
申请号: 202110788327.X 申请日: 2021-07-13
公开(公告)号: CN113486828A 公开(公告)日: 2021-10-08
发明(设计)人: 徐青松;李青 申请(专利权)人: 杭州睿胜软件有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06T7/136;G06K9/62;G06N3/04;G06N3/08;G06T7/13;G06T7/155;G06T7/187;G06T7/62;G06T3/40
代理公司: 北京市柳沈律师事务所 11105 代理人: 罗莎
地址: 310053 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 处理 方法 装置 设备 存储 介质
【说明书】:

一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。图像处理方法包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象。

技术领域

本公开的实施例涉及一种图像处理方法、图像处理装置、电子设备和计算机可读存储介质。

背景技术

随着数字化技术的发展,可以利用文本识别技术等对文本图像进行识别,以获取文本图像记载的信息,例如利用OCR(Optical Character Recognition,光学字符识别)识别技术,将图片、照片上的文字内容,直接转换为可编辑的文本。然而,目前的文字识别算法的复杂度高、计算量大,因而对使用环境存在限制,只适用于在服务器等硬件配置较高的设备上执行,而在终端设备等硬件配置较低的设备上执行时会导致识别速度很慢甚至不能识别的问题,因而在终端设备离线的情况下不易进行文字识别。

发明内容

本公开至少一个实施例提供一种图像处理方法,包括:获得初始图像,初始图像包括至少一个目标对象;对初始图像进行处理以得到中间图像;利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像;确定在连通图像中与M个对象连通区域分别对应的M个包围框;基于M个包围框,从初始图像中截取N个图像块,每个图像块包括至少一个目标对象;以及利用对象识别模型识别N个图像块,以得到初始图像中的目标对象,M和N均为正整数。

例如,在本公开一实施例提供的图像处理方法中,利用区域检测模型对中间图像进行识别,以得到包括M个对象连通区域的连通图像,包括:利用区域检测模型处理中间图像,得到包括多个初始对象连通区域的连通图像;对包括多个初始对象连通区域的连通图像进行形态学变换,以基于包括多个初始对象连通区域的连通图像得到包括M个对象连通区域的连通图像。

例如,在本公开一实施例提供的图像处理方法中,对初始图像进行处理以得到中间图像包括:将初始图像的尺寸由初始尺寸缩小至预定尺寸;对预定尺寸的初始图像进行二值化处理,得到中间图像。

例如,在本公开一实施例提供的图像处理方法中,确定在连通图像中与M个对象连通区域分别对应的M个包围框,包括:提取M个对象连通区域各自的轮廓信息;基于轮廓信息,确定M个对象连通区域各自的包围框。

例如,在本公开一实施例提供的图像处理方法中,基于M个包围框,从初始图像中截取N个图像块,包括:根据中间图像和初始图像之间的对应关系,基于M个包围框中的每个包围框,对应截取初始图像中的一个图像块,M与N相等;或者对M个包围框进行预定处理,得到N个处理后的包围框,并根据中间图像和初始图像之间的对应关系,基于每个处理后的包围框,对应截取初始图像中的一个图像块。

例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包括:对M个包围框进行评分,以得到M个包围框分别对应的质量分值;将质量分值小于分值阈值的包围框作为无效包围框,并删除无效包围框。

例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行评分包括:针对M个包围框中的每个包围框执行以下操作:确定包围框的面积和位于包围框中的目标对象对应的像素的面积;基于像素的面积与包围框的面积的比例,确定包围框对应的质量分值。

例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,包括:将M个包围框中的一个或多个包围框放大第一预定倍数。

例如,在本公开一实施例提供的图像处理方法中,对M个包围框进行预定处理,还包括:检测M个包围框中每相邻两个包围框之间是否至少部分区域重叠,若是,将至少部分区域重叠的两个包围框中的每个包围框基于第二预定倍数进行缩小处理,以使得缩小后的两个包围框不重叠或者重叠区域减小。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州睿胜软件有限公司,未经杭州睿胜软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110788327.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top