[发明专利]基于多任务深度哈希学习的大规模物流商品图像检索方法有效
申请号: | 202110732492.3 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113377981B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 聂秀山;王乐天;刘兴波;王少华 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 支文彬 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 深度 学习 大规模 物流 商品 图像 检索 方法 | ||
一种基于多任务深度哈希学习的大规模物流商品图像检索方法,通过基于多任务的思想,可以同时学到多种长度的哈希码作为图像的高级表征。与传统的单任务相比,解决了单任务下模型重新训练导致的硬件资源浪费和时间成本开销大等弊端。与传统仅仅考虑学习单个哈希码作为图像的表征并来用检索相比。挖掘了多种长度哈希码之间的信息关联,设计了互信息损失来增强其哈希码的表征能力,解决了单个哈希码表征能力不强的弊端,进而提高哈希码的检索性能。同时模型是基于端到端的学习,即图像的特征提取和哈希码的学习是同时进行的,与传统的线性哈希方法相比,模型结构直观,容易迁移与部署实现。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于多任务深度哈希学习的大规模物流商品图像检索方法。
背景技术
随着互联网和电子技术的高速发展,网上的信息量的增长异常迅速,几乎每秒钟都会上传大量的文本,图像,音频等多媒体的数据。这给很多需要进行高效最近邻搜索的领域带了极大的挑战,尤其是大规模的图像检索。当数据库中的图像数据量较少的时候,我们可以使用最简单直接的穷尽搜索方式:即将数据库中的点与查询点一一比较欧式距离,最终根据距离的大小排序。时间复杂度为线性复杂度O(dn),d和n分别是数据的维度和样本数。但是,当图像的数据量的规模比较庞大,如有上百万到上亿张图像的时候,线性搜索的方式已经不适用。另外,如在计算机视觉领域,已经越来越倾向使用高维度数据或者结构化的数据在更加精确地表达物品图像信息,并且使用复杂的相似度公式计算物品图像间的距离。在这些情况下,穷尽搜索的方式存在很大的局限性,无法高效的地完成最近邻搜索。
因此,人们开始使用近似最近邻搜索(Approximate Nearest Neighbor Search)方法快速地搜索有效解。而哈希方法是一类广泛研究的近似最近邻搜索算法,其能将文档、图像、视频等多媒体信息转换成一个紧凑的二进制编码,并保留原始数据间的相似性关系。该二进制编码(也称哈希码)间的距离度量使用的是汉明距离,其可以通过硬件的异或运算进行快速求解。因此,哈希方法能够在存储和效率上具备极大的优势,这也造成了其成为最流行的近似最近邻搜索算法之一。本发明面向的是物流行业的大规模图像检索领域,那么如何快速有效的从数据库中检索出我们需要的图片成为问题。而基于最近邻算法的哈希学习凭借其优势成为近些年来在大规模数据上做检索的利器。
大多数的哈希方法首先为用来检索的哈希码预定一个固定的长度(例如:16,32,48等)。然后训练模型学习这个长度的哈希码作为图像的高级表征并用来快速有效的检索大规模的多媒体数据。如果预定义好哈希码的长度,当需求发生改变,我们需要另一长度的哈希码用做表征和检索,我们就需要重新训练模型学习新的长度的哈希码,这就造成了硬件资源浪费和时间成本的增加。其次,我们知道哈希码是原始样本的紧凑表示,一个样本可以用不同长度的哈希码表示。直观的来说,代表相同样本的不同长度的哈希码反映与原始样本不同类型的特定信息。如果我们将它们视为原始样本的不同试图,不同视图之间应该存在一定的区别和联系。如果我们仅仅考虑一种长度的哈希码,则会忽略它们之间潜在的关联,进而造成交互信息的损失,导致表征能力的不足和检索精度处于较低的水平。而且大多数线性非深度的哈希方法,特征提取和哈希函数学习具有异步性。哈希函数的设计较为复杂,且模型的优化方法更是一个难点。
发明内容
本发明为了克服以上技术的不足,提供了一种提高哈希检索性能的基于多任务深度哈希学习的大规模物流商品图像检索方法。
本发明克服其技术问题所采用的技术方案是:
一种基于多任务深度哈希学习的大规模物流商品图像检索方法,包括如下步骤:
a)对输入的物流商品图像xi进行图像预处理,根据图像xi的标签构建物流商品图像之间的相似度矩阵S;
b)将预处理后的物流商品图像经过卷积、池化处理后得到图像的一维特征向量himg,将一维特征向量himg作为图像低级特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732492.3/2.html,转载请声明来源钻瓜专利网。