[发明专利]图像检测方法、装置、电子设备和计算机可读介质有效
| 申请号: | 201810299489.5 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN108520229B | 公开(公告)日: | 2020-08-07 |
| 发明(设计)人: | 王剑锋;袁野;李伯勋;俞刚 | 申请(专利权)人: | 北京旷视科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 戈丰 |
| 地址: | 100000 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 检测 方法 装置 电子设备 计算机 可读 介质 | ||
本发明提供了一种图像检测方法、装置、电子设备和计算机可读介质,涉及图像识别领域,该方法包括:通过目标骨干网络对待处理图像进行多尺度处理,得到多尺度特征图像;通过基于锚的第一网络分支和不基于锚的第二网络分支对多尺度特征图像进行处理,分别得到第一处理结果和第二处理结果,其中,第一处理结果和第二处理结果中分别包括:目标检测框的位置信息和/或目标检测框中包含目标对象的概率;对第一处理结果和第二处理结果进行融合,并基于融合结果确定待处理图像的目标对象检测结果。本发明缓解现有的图像检测技术在对大尺度变化的图像进行检测时检测性能较低的技术问题。
技术领域
本发明涉及图像识别领域,尤其是涉及一种图像检测方法、装置、电子设备和计算机可读介质。
背景技术
图像检测技术对于很多涉及到人脸检测技术的应用是非常基础,并且至关重要的。例如,人脸识别,人脸美妆,人脸AR(Augmented Reality,增强现实技术)等。在高分辨率的图像或者视频中,人脸的尺度变化范围非常大。例如,在4K(即,3840×2160)的图像中,人脸的尺度变化范围非常大,可能从10×10变化到2000×2000。现有的图像检测技术还难以处理这样大的尺度变化。
针对上述问题,还有提出有效解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种图像检测方法、装置、电子设备和计算机可读介质,以缓解现有的图像检测技术在对大尺度变化的图像进行检测时检测性能较低的技术问题。
第一方面,本发明实施例提供了一种图像检测方法,包括:通过目标骨干网络对待处理图像进行多尺度处理,得到多尺度特征图像;通过基于锚的第一网络分支和不基于锚的第二网络分支对所述多尺度特征图像进行处理,分别得到第一处理结果和第二处理结果,其中,所述第一处理结果和所述第二处理结果中分别包括:目标检测框的位置信息和/或所述目标检测框中包含目标对象的概率;对所述第一处理结果和所述第二处理结果进行融合,并基于融合结果确定所述待处理图像的目标对象检测结果。
进一步地,通过第一网络分支和第二网络分支对所述多尺度特征图像进行处理,分别得到第一处理结果和第二处理结果包括:通过第一网络分支对所述多尺度特征图像中每个尺度的特征图像进行处理,得到第一处理结果;通过第二网络分支对所述多尺度特征图像中至少一个尺度的特征图像进行处理,得到第二处理结果。
进一步地,通过第二网络分支对所述多尺度特征图像中至少一个尺度的特征图像进行处理,得到第二处理结果包括:通过所述第二网络分支对所述多尺度特征图像中尺度最小的特征图像进行处理,得到所述第二处理结果;或者,通过所述第二网络分支对所述多尺度特征图像中尺度小于预设尺度的特征图像进行处理,得到所述第二处理结果。
进一步地,通过第一网络分支对所述多尺度特征图像中每个尺度的特征图像进行处理,得到第一处理结果包括:通过所述第一网络分支中的分类子网络对所述每个尺度的特征图像进行卷积处理,并对处理结果进行归一化处理,得到第一数值,所述第一数值表示所述每个尺度的特征图像中的每个锚包括目标对象的概率;通过所述第一网络分支中的回归子网络对所述特征图像进行处理,得到每个所述锚的位置信息;将所述第一数值中的第一目标数值和/或所述第一目标数值所对应的锚的位置信息作为所述第一处理结果,其中,所述第一目标数值为所述第一数值中大于第一预设数值的数值。
进一步地,通过第二网络分支对所述多尺度特征图像中至少一个尺度的特征图像进行处理,得到第二处理结果包括:通过所述第二网络分支中的分类子网络对所述至少一个尺度的特征图像进行卷积处理,并对卷积处理结果进行归一化处理,得到第二数值,所述第二数值表示所述至少一个尺度中每个特征图像的每个像素点位于目标对象上的概率;通过所述第二网络分支中的回归子网络对所述特征图像进行处理,得到所述每个像素点所对应的区域框的位置信息;将所述第二数值中的第二目标数值和/或所述第二目标数值所对应的像素点的区域框的位置信息作为所述第二处理结果,其中,所述第二目标数值为所述第二数值中大于第二预设数值的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810299489.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手势匹配方法及装置
- 下一篇:一种3D四维手部图像数据识别方法及设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





