[发明专利]图像识别方法、装置及系统有效
申请号: | 201810521462.6 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108764133B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈文科;姚聪 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 魏彦 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 系统 | ||
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别图像;
将所述待识别图像输入至卷积神经网络模型;其中,所述卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块;
通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取,得到所述待识别图像的识别结果;所述识别结果包括所述待识别图像上至少一个目标点的位置。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过所述待识别图像的导向概率热力图对所述卷积神经网络模型进行训练,直至所述卷积神经网络模型的误差收敛至预设值,将所述误差收敛至所述预设值时对应的参数作为所述卷积神经网络模型的参数。
3.根据权利要求2所述的方法,其特征在于,当下述条件均满足时,确定所述卷积神经网络模型的误差收敛至预设值:所述沙漏模块的损失函数值小于第一预设值;所述级联特征金字塔模块的损失函数值小于第二预设值。
4.根据权利要求2所述的方法,其特征在于,所述导向概率热力图的生成如下:
获取当前训练样本的真实热力图;
根据所述真实热力图构建向导热力图;其中,所述向导热力图和所述真实热力图的中心与所述当前训练样本的目标点的位置相同;
将所述向导热力图与真实热力图融合,得到导向概率热力图。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取待识别图像的步骤,包括:
通过单目摄像头采集图像,并检测所述图像中的手部图像;
将所述手部图像作为待识别图像。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述卷积神经网络模型还包括卷积层;所述通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取,得到所述待识别图像的识别结果的步骤,包括:
通过所述卷积层对输入的所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图,并将所述第一特征图输入至所述残差金字塔模块;
通过所述残差金字塔模块对所述第一特征图进行多尺度特征提取,得到所述待识别图像的第二特征图,并将所述第二特征图输入至所述沙漏模块;
通过至少一个所述沙漏模块对所述第二特征图进行多尺度特征提取,得到所述待识别图像的第三特征图,并将所述第三特征图输入至所述级联特征金字塔模块;
通过所述级联特征金字塔模块对所述第三特征图进行多尺度特征提取,输出识别结果。
7.根据权利要求6所述的方法,其特征在于,所述残差金字塔模块包括主分支和金字塔分支;
所述通过所述残差金字塔模块对所述第一特征图进行多尺度特征提取,得到所述待识别图像的第二特征图的步骤,包括:
将所述第一特征图分别输入所述主分支和所述金字塔分支;
所述主分支和所述金字塔分支分别对所述第一特征图进行特征提取;
将所述主分支和所述金字塔分支提取得到的特征信息融合,得到所述待识别图像的第二特征图。
8.根据权利要求6所述的方法,其特征在于,所述沙漏模块包括多个残差模块和卷积层;
所述通过至少一个所述沙漏模块对所述第二特征图进行多尺度特征提取,得到所述待识别图像的第三特征图,并将所述第三特征图输入至所述级联特征金字塔模块的步骤,包括:
将所述第二特征图逐级通过所述残差模块,得到不同尺度的特征信息以及将所述第二特征图缩小至预设分辨率;
对所述预设分辨率的所述第二特征图进行上采样,并逐渐结合所述特征信息,得到与所述第二特征图分辨率相同的初步特征图;
将所述初步特征图输入所述卷积层得到所述待识别图像的第三特征图,并将所述第三特征图输入至所述级联特征金字塔模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810521462.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序