[发明专利]基于多任务深度哈希学习的大规模物流商品图像检索方法有效
申请号: | 202110732492.3 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113377981B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 聂秀山;王乐天;刘兴波;王少华 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 支文彬 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 深度 学习 大规模 物流 商品 图像 检索 方法 | ||
1.一种基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于,包括如下步骤:
a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S;
b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,将一维特征向量himg作为图像低级特征;
c)将图像低级特征himg输入多分支的网络中得到多个长度哈希码表示的图像的高级表征Bk,多分支网络由N个相同结构的分支组成;
d)通过公式计算相似度损失函数SILoss,sij为第i张图像与第j张图像之间的相似度,sij∈{1,0},sij取值为1时表示第i张图像与第j张图像相似,sij取值为0时表示第i张图像与第j张图像不相似,bi为第i张图像数据的二值哈希码,bj为第j张图像数据的二值哈希码,T为转置;
e)通过公式计算互信息损失函数MILoss,式中Bk为第k个分支输出的哈希码,k∈0,...,N-1,Bk+1为第k+1个分支输出的哈希码,Wk为将第k个分支输出的哈希码映射到第k+1个分支输出的哈希码的映射矩阵,γk为正则化参数,||·||1为L1范数,ak为优化参数;
f)利用随机梯度下降算法对相似度损失函数SILoss和互信息损失函数MILoss进行优化,优化后重复执行步骤a)至步骤e)大于等于M次,得到训练后的模型;
g)将数据库中的图像数据输入到步骤f)中训练后的模型中,得到每张图像的不同长度的二值哈希码表示组合Bdatabase;
h)将需要检索的图片imgquery输入到步骤f)中训练后的模型中,得到需要检索图片imgquery的二值哈希码表示组合Bquery;
i)通过公式计算汉明距离DistHamming,将计算得到的汉明距离DistHamming基于Average Precision的度量方式返回所有检索图片查询集的平均检索精度Mean Average Precision,完成相似性检索。
2.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤b)中有5个卷积层,每个卷积层后接入一个池化层,所述卷积层采用3*3大小的卷积核,所述池化层采用2*2大小的池化核,所述卷积层和池化层均采用Relu激活函数。
3.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中多分支网络由N个相同结构的分支组成,每个分支内部由3层全连接层相互串联构成。
4.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中N取值为大于0的正整数。
5.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤f)中M取值为5000。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732492.3/1.html,转载请声明来源钻瓜专利网。