[发明专利]图像识别方法、装置和系统及存储介质在审
| 申请号: | 201810161994.3 | 申请日: | 2018-02-27 |
| 公开(公告)号: | CN108875932A | 公开(公告)日: | 2018-11-23 |
| 发明(设计)人: | 周舒畅;何蔚然;谢广增 | 申请(专利权)人: | 北京旷视科技有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/46 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
| 地址: | 100190 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像识别 存储介质 共享图像 特征提取 共享 对象属性 属性识别 属性信息 网络 图像 预测 目标属性信息 获取目标 目标对象 神经网络 特征输入 图像输入 网络参数 网络输出 网络提取 计算量 减小 | ||
本发明实施例提供一种图像识别方法、装置和系统以及存储介质。图像识别方法包括:获取目标对象的待识别图像;将待识别图像输入属性识别网络中的共享特征提取网络,以提取待识别图像的共享图像特征;以及将共享图像特征输入属性识别网络中的属性信息预测网络,以获得属性信息预测网络输出的与目标对象的n个对象属性一一对应的目标属性信息,其中,n为大于或等于2的整数。根据本发明实施例的图像识别方法、装置和系统以及存储介质,采用共享特征提取网络提取待识别图像的共享图像特征,多种不同的对象属性的预测流程可以共享该共享特征提取网络的网络参数,这样做可以大大减少神经网络的参数量,减小数据的计算量。
技术领域
本发明涉及图像识别领域,更具体地涉及一种图像识别方法、装置和系统以及存储介质。
背景技术
神经网络在图像识别、语音识别等领域中已经有了广泛且成功的应用。目前利用神经网络对一张对象图像(例如人脸图像)进行多属性识别的一般方法是:将图像输入多个已经训练好的神经网络,每个神经网络对应于一个特定的对象属性,每个神经网络用于预测对应对象属性的属性信息。有时需要识别的对象属性可能有很多种,每个对象属性都需要训练一个神经网络,此时所需要的计算资源是非常多的,将这样的属性识别方案部署在一些硬件上可能会变得非常困难。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种图像识别方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种图像识别方法。图像识别方法包括:获取目标对象的待识别图像;将待识别图像输入属性识别网络中的共享特征提取网络,以提取待识别图像的共享图像特征;以及将共享图像特征输入属性识别网络中的属性信息预测网络,以获得属性信息预测网络输出的与目标对象的n个对象属性一一对应的目标属性信息,其中,n为大于或等于2的整数。
示例性地,属性信息预测网络包括与n个对象属性一一对应的n个网络分支,n个网络分支中的每一个包括专用特征提取网络和属性预测器,将共享图像特征输入属性识别网络中的属性信息预测网络,以获得属性信息预测网络输出的与目标对象的n个对象属性一一对应的目标属性信息包括:将共享图像特征分别输入n个网络分支中的专用特征提取网络,以获得与n个网络分支分别对应的专用图像特征;对于n个网络分支中的k个网络分支中的每一个,将来自至少一个其他网络分支的分支特征与该网络分支所对应的专用图像特征进行合并,以获得与该网络分支相对应的合并特征,其中,k为小于或等于n的整数,至少一个其他网络分支中的每个网络分支所对应的分支特征为该网络分支所对应的专用图像特征或该网络分支所对应的合并特征;将k个网络分支所对应的合并特征分别输入k个网络分支中的k个属性预测器,并将n个网络分支中的剩余网络分支所对应的专用图像特征分别输入剩余网络分支中的属性预测器,以获得由n个属性预测器分别输出的目标属性信息。
示例性地,对于n个网络分支中的k个网络分支中的每一个,将来自至少一个其他网络分支的分支特征与该网络分支所对应的专用图像特征进行合并,以获得与该网络分支相对应的合并特征包括:对于k个网络分支中的每一个,通过信道拼接的方式,将来自至少一个其他网络分支的分支特征与该网络分支所对应的专用图像特征进行合并,以获得与该网络分支相对应的合并特征。
示例性地,属性信息预测网络包括m个专用特征提取网络和n个属性预测器,m为大于或等于2的整数,n个属性预测器与n个对象属性一一对应,每个属性预测器用于预测对应对象属性的目标属性信息,将共享图像特征输入属性识别网络中的属性信息预测网络,以获得属性信息预测网络输出的与目标对象的n个对象属性一一对应的目标属性信息包括:将共享图像特征分别输入m个专用特征提取网络,以获得由m个专用特征提取网络分别输出的专用图像特征;将m个专用特征提取网络中的每一个输出的专用图像特征输入与该专用特征提取网络连接的属性预测器,以获得由n个属性预测器分别输出的目标属性信息。
示例性地,n个对象属性根据预设规则划分为m个属性组,m个属性组与m个专用特征提取网络一一对应,m个专用特征提取网络中的每一个与对应属性组中的对象属性所对应的属性预测器连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810161994.3/2.html,转载请声明来源钻瓜专利网。





