[发明专利]基于多任务深度哈希学习的大规模物流商品图像检索方法有效

专利信息
申请号: 202110732492.3 申请日: 2021-06-29
公开(公告)号: CN113377981B 公开(公告)日: 2022-05-27
发明(设计)人: 聂秀山;王乐天;刘兴波;王少华 申请(专利权)人: 山东建筑大学
主分类号: G06F16/53 分类号: G06F16/53
代理公司: 济南泉城专利商标事务所 37218 代理人: 支文彬
地址: 250101 山东省济*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 任务 深度 学习 大规模 物流 商品 图像 检索 方法
【权利要求书】:

1.一种基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于,包括如下步骤:

a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S;

b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,将一维特征向量himg作为图像低级特征;

c)将图像低级特征himg输入多分支的网络中得到多个长度哈希码表示的图像的高级表征Bk,多分支网络由N个相同结构的分支组成;

d)通过公式计算相似度损失函数SILoss,sij为第i张图像与第j张图像之间的相似度,sij∈{1,0},sij取值为1时表示第i张图像与第j张图像相似,sij取值为0时表示第i张图像与第j张图像不相似,bi为第i张图像数据的二值哈希码,bj为第j张图像数据的二值哈希码,T为转置;

e)通过公式计算互信息损失函数MILoss,式中Bk为第k个分支输出的哈希码,k∈0,...,N-1,Bk+1为第k+1个分支输出的哈希码,Wk为将第k个分支输出的哈希码映射到第k+1个分支输出的哈希码的映射矩阵,γk为正则化参数,||·||1为L1范数,ak为优化参数;

f)利用随机梯度下降算法对相似度损失函数SILoss和互信息损失函数MILoss进行优化,优化后重复执行步骤a)至步骤e)大于等于M次,得到训练后的模型;

g)将数据库中的图像数据输入到步骤f)中训练后的模型中,得到每张图像的不同长度的二值哈希码表示组合Bdatabase

h)将需要检索的图片imgquery输入到步骤f)中训练后的模型中,得到需要检索图片imgquery的二值哈希码表示组合Bquery

i)通过公式计算汉明距离DistHamming,将计算得到的汉明距离DistHamming基于Average Precision的度量方式返回所有检索图片查询集的平均检索精度Mean Average Precision,完成相似性检索。

2.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤b)中有5个卷积层,每个卷积层后接入一个池化层,所述卷积层采用3*3大小的卷积核,所述池化层采用2*2大小的池化核,所述卷积层和池化层均采用Relu激活函数。

3.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中多分支网络由N个相同结构的分支组成,每个分支内部由3层全连接层相互串联构成。

4.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤c)中N取值为大于0的正整数。

5.根据权利要求1所述的基于多任务深度哈希学习的大规模物流商品图像检索方法,其特征在于:步骤f)中M取值为5000。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110732492.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top