[发明专利]图像识别方法、装置及系统有效
申请号: | 201810521462.6 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108764133B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈文科;姚聪 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 魏彦 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 系统 | ||
本发明提供了一种图像识别方法、装置及系统,涉及图像识别技术领域,该方法包括:获取待识别图像;将待识别图像输入至卷积神经网络模型;其中,卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块;通过卷积神经网络模型中的残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对待识别图像进行特征提取,得到待识别图像的识别结果;识别结果包括至少一个目标点的位置。本发明可以基于单目摄像头拍摄的图像进行识别,并且能够提高图像识别的准确率。
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种图像识别方法、装置及系统。
背景技术
由于手部姿态存在高形变、自遮挡、互遮挡、外部遮挡以及背景噪音等特点,基于普通摄像头进行手部姿态识别是非常困难的。现有技术通常依赖于多个普通摄像头,从而获取多角度的手部姿态的图像,再进行手部姿态识别。
然而,上述手部姿态识别的方法,在应用时需要布置多个摄像头,并且需要进行摄像头的基准测试等,导致实际应用非常受限,而且模型的准确性也有待进一步提高。
发明内容
有鉴于此,本发明的目的在于提供一种图像识别方法、装置及系统,可以通过单目摄像头进行图像识别,且提高了识别的准确率。
第一方面,本发明实施例提供了一种图像识别方法,包括:获取待识别图像;将所述待识别图像输入至卷积神经网络模型;其中,所述卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块;通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取,得到所述待识别图像的识别结果;所述识别结果包括所述待识别图像上至少一个目标点的位置。
进一步,所述方法还包括:通过所述待识别图像的导向概率热力图对所述卷积神经网络模型进行训练,直至所述卷积神经网络模型的误差收敛至预设值,将所述误差收敛至所述预设值时对应的参数作为所述卷积神经网络模型的参数。
进一步,当下述条件均满足时,确定所述卷积神经网络模型的误差收敛至预设值:所述沙漏模块的损失函数值小于第一预设值;所述级联特征金字塔模块的损失函数值小于第二预设值。
进一步,所述导向概率热力图的生成如下:获取当前训练样本的真实热力图;根据所述真实热力图构建向导热力图;其中,所述向导热力图和所述真实热力图的中心与所述当前训练样本的目标点的位置相同;将所述向导热力图与真实热力图融合,得到导向概率热力图。
进一步,所述获取待识别图像的步骤,包括:通过单目摄像头采集图像,并检测该图像中的手部图像;将该手部图像作为待识别图像。
进一步,所述卷积神经网络模型还包括卷积层;所述通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取,得到所述待识别图像的识别结果的步骤,包括:通过所述卷积层对输入的所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图,并将所述第一特征图输入至所述残差金字塔模块;通过所述残差金字塔模块对所述第一特征图进行多尺度特征提取,得到所述待识别图像的第二特征图,并将所述第二特征图输入至所述沙漏模块;通过至少一个所述沙漏模块对所述第二特征图进行多尺度特征提取,得到所述待识别图像的第三特征图,并将所述第三特征图输入至所述级联特征金字塔模块;通过所述级联特征金字塔模块对所述第三特征图进行多尺度特征提取,输出识别结果。
进一步,所述残差金字塔模块包括主分支和金字塔分支,所述主分支包括至少一层卷积层;所述通过所述残差金字塔模块对所述第一特征图进行多尺度特征提取,得到所述待识别图像的第二特征图的步骤,包括:将所述第一特征图分别输入所述主分支和所述金字塔分支;所述主分支和所述金字塔分支分别对所述第一特征图进行特征提取;将所述主分支和所述金字塔分支提取得到的特征信息融合,得到所述待识别图像的第二特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810521462.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序