[发明专利]一种基于深度学习细粒度人脸图像快速检索方法有效
申请号: | 201710703271.7 | 申请日: | 2017-08-16 |
公开(公告)号: | CN107480261B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 刘威鑫;马雷;张雪婷 | 申请(专利权)人: | 上海荷福人工智能科技(集团)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 徐丰;张巨箭 |
地址: | 201600 上海市松*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 细粒 度人 图像 快速 检索 方法 | ||
本发明提供了一种基于深度学习细粒度人脸图像快速检索方法,包括:构建深度卷积神经网络模型,并在深度卷积神经网络模型的各分支层添加用于计算损失函数的损失层;对深度卷积神经网络模型的参数进行初始化;构建数据集,并按照预设比例,将所述数据集中的图片随机划分成训练集、测试集、验证集;设定深度卷积神经网络模型的学习参数;对深度卷积神经网络模型进行训练,采用随机梯度下降和反向传播算法更新所述深度卷积神经网络模型的参数;对训练后的深度卷积神经网络模型进行测试,具体是经过粗粒度测试和细粒度测试,获得人脸检索结果,从而提高了图片检索的效率以及图片检索的精度。
技术领域
本发明涉及图像检索技术领域,尤其涉及一种基于深度学习细粒度人脸图像快速检索方法。
背景技术
随着手机、监控摄设备采集图像的便利化以及互联网如微博、微信的普及,数据的规模呈现爆炸式地增长。这些数据大大增加了计算设备存储及计算负担。以人脸检索为例,我们首先需要从百万级数据中提取实值特征如GIST特征、LBP特征以及CNN特征。其次使用欧式距离或者内积作为相似性距离测度,对数据库中的图片按照与查询图片的相似度进行排序。存储这些实值特征需要占用大量的计算机内存,而且计算这些实值特征之间欧式距离或者内积距离需要大量的CPU浮点运算。
哈希技术可以将实值的人脸特征转换成二值的人脸特征(二值码/哈希码),并且同时保持人脸样本之间的相似性。换而言之,通过哈希技术我们可以将人脸特征从实值空间映射到二值空间,并且使得实值空间里距离比较远的两张人脸在二值空间里的汉明距离比较大,相反实值空间里距离比较近的两张人脸在二值空间里的汉明距离比较小。特征二值化后不仅节省了内存开销,而且二值化特征之间的汉明距离可以使用异或操作快速计算。因此,我们可以使用哈希技术减少人脸样本的存储空间并提高人脸的检索效率。虽然哈希技术可以帮助我们提高人脸的检索速度,但是这种方法的检索精度严重依赖于提取特征的表示能力强弱。以传统的图像哈希方法为例,基于手工特征如GIST、LBP等学习到的图像二值码未取得理想的图像检索效果。主要原因是这些特征的表示能力较弱。
以往基于哈希的人脸检索算法大都采用传统的图像哈希算法,即从图像中提取手工特征然后利用这些特征学习哈希码。这种方法的缺点包括不能学习到最优的哈希码,而且这种方式学习到的哈希码的检索性能不理想。
因此,现有技术中图像检索存在效率低,检索精度差的技术问题。
发明内容
为了解决现有技术中图像检索存在效率低,检索精度差的技术问题,本发明提供了一种基于深度学习细粒度人脸图像快速检索方法,进而提高了图像检索的效率,提高了图像检索的精度。
本发明主要解决的技术问题是提供一种基于深度学习细粒度人脸图像快速检索方法,包括如下内容:
构建深度卷积神经网络模型,并在所述深度卷积神经网络模型的各分支层添加用于计算损失函数的损失层;
对所述深度卷积神经网络模型的参数进行初始化;
构建数据集,并按照预设比例,将所述数据集中的图片随机划分成训练集、测试集、验证集;
设定深度卷积神经网络模型的学习参数,具体包括设定深度卷积神经网络模型中的各个损失层对应的权重,各分支层的学习率、动量因子以及权重衰减,一次输入批量样本的数量,网络训练的迭代次数;
对所述深度卷积神经网络模型进行训练,采用随机梯度下降和反向传播算法更新所述深度卷积神经网络模型的参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海荷福人工智能科技(集团)有限公司,未经上海荷福人工智能科技(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710703271.7/2.html,转载请声明来源钻瓜专利网。