[发明专利]图像处理方法、装置和系统及存储介质有效
申请号: | 201710992110.4 | 申请日: | 2017-10-23 |
公开(公告)号: | CN108876791B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 彭超;俞刚 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/143;G06T7/194;G06T7/62;G06K9/32;G06N3/04 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 系统 存储 介质 | ||
本发明实施例提供一种图像处理方法、装置和系统以及存储介质。该图像处理方法包括:获取待处理图像;检测待处理图像中的目标对象,以确定至少一个对象候选区域以及对象候选区域的面积,其中,对象候选区域用于指示对应的目标对象所在的位置;根据对象候选区域的面积对至少一个对象候选区域进行筛选;以及确定筛选出的对象候选区域为前景区域。通过上述图像处理方法,可以基于面积区分感兴趣的重要对象以及不重要的对象,使得从多个目标对象中自动识别和提取重要对象成为可能。
技术领域
本发明涉及图像处理领域,更具体地涉及一种图像处理方法、装置和系统以及存储介质。
背景技术
在一些区分前景(即目标对象所在部分)和背景的图像分割应用中,并不会对检测出的目标对象进行取舍。下面以人形抠像为例进行说明。人形抠像系统在业界已有广泛的应用,例如在直播、美图、视频制作等场景。现有的人形抠像系统往往只会单独把图片或视频中的人体部分分割出来,但并不会区分每个人体的位置和大小。在较为复杂的场景(例如商场、闹市等)之下,人们往往希望屏蔽掉背景中的无关人体,仅保留重要的“主角”。现有的人形抠像技术已经很难满足用户的这种需求,业界也迫切希望找到合适的技术方案。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种图像处理方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种图像处理方法。该图像处理方法包括:获取待处理图像;检测待处理图像中的目标对象,以确定至少一个对象候选区域以及对象候选区域的面积,其中,对象候选区域用于指示对应的目标对象所在的位置;根据对象候选区域的面积对至少一个对象候选区域进行筛选;以及确定筛选出的对象候选区域为前景区域。
示例性地,检测待处理图像中的目标对象,以确定至少一个对象候选区域以及对象候选区域的面积包括:利用第一卷积神经网络提取待处理图像的特征,以获得第一图像特征图;将第一图像特征图输入区域建议网络,以获得与多个初始候选区域分别相关的区域信息;将第一图像特征图输入第二卷积神经网络,以获得第二图像特征图;将第二图像特征图和与多个初始候选区域分别相关的区域信息输入感兴趣区域池化网络,以获得与多个初始候选区域分别对应的区域特征图;将所有区域特征图输入基于区域的卷积神经网络,以获得与至少一个对象候选区域分别相关的区域信息;以及对于至少一个对象候选区域中的每一个,根据与该对象候选区域相关的区域信息计算该对象候选区域的面积。
示例性地,确定筛选出的对象候选区域为前景区域包括:检测待处理图像中的目标对象,以获得初始概率矩阵,其中,初始概率矩阵中的每个元素的值代表待处理图像中的对应像素属于目标对象的置信度;计算筛选出的对象候选区域的覆盖区域;对于初始概率矩阵,保留与待处理图像中的覆盖区域对应的元素的值,并将与待处理图像中的其他区域对应的元素的值设置为用于指示对应像素属于背景的预设值,以获得新的概率矩阵;以及基于新的概率矩阵对待处理图像进行图像分割以确定前景区域。
示例性地,在基于新的概率矩阵对待处理图像进行图像分割之后,方法还包括:基于图像分割结果对待处理图像进行抠像。
示例性地,第一卷积神经网络包括至少一个子网络{C1,……Cn},其中,n≥1,在n≥2的情况下,子网络{C1,……Cn}按照正向的编号顺序依次连接,检测待处理图像中的目标对象,以获得初始概率矩阵包括:将第二图像特征图输入第三卷积神经网络中的子网络Nn+1,其中,第三卷积神经网络还包括与子网络{C1,……Cn}一一对应的子网络{N1,……Nn},在n≥2的情况下,子网络{N1,……Nn}按照反向的编号顺序依次连接;以及对于第一卷积神经网络中的每个子网络,将该子网络输出的特征图输入第三卷积神经网络中的、与该子网络对应的子网络,以获得由子网络N1输出的初始概率矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710992110.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序