[发明专利]商品检索方法、装置及电子设备在审
| 申请号: | 201810999636.X | 申请日: | 2018-08-29 |
| 公开(公告)号: | CN110019917A | 公开(公告)日: | 2019-07-16 |
| 发明(设计)人: | 崔权;谢烟平 | 申请(专利权)人: | 北京旷视科技有限公司 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06Q30/02;G06N3/04 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 唐维虎 |
| 地址: | 100000 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 商品检索 装置及电子设备 神经网络模型 检索特征 检索图像 商品特征 图像处理技术 海量数据 零售行业 模型训练 特征提取 提取图像 图像检索 旋转变换 预先建立 智能化 图像 场景 零售 | ||
本发明提供了一种商品检索方法、装置及电子设备,涉及图像处理技术领域,该方法首先基于预训练的神经网络模型,提取该待检索图像的待检索特征;根据该待检索图像的待检索特征,基于预先建立的商品特征库,进行商品检索;其中上述商品特征库是基于上述预训练的神经网络模型,对旋转变换后的待提取图像进行特征提取而建立的。在两个方面克服目前新零售场景下的商品检索难度大的问题,能够更加有力的区分不同图像之间的不同,降低模型训练时对海量数据的依赖性,在提高图像检索精度的基础上,促进新零售行业的智能化发展。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种商品检索方法、装置及电子设备。
背景技术
商品检索的本质问题是图像检索(image retrieval)问题,图像检索是计算机视觉领域中一项重要的研究课题,在新零售场景中,商品检索是非常关键的一步,商品检索的精度直接决定了零售模型的表现。
目前在研究中,进行检索的图片大多具有相差较大的外观,充足的光线,并且无遮挡,检索难度不大。但是在零售场景下的商品检索问题中,我们面对的主要困难有:商品的细粒度(fine-grained)特性,即商品间的外观相似;角度、光线条件的变化;遮挡问题等。在使用目前提出的图像检索方法来解决商品检索问题时,需要依赖海量数据进行模型训练,且检索精度低,阻碍了新零售行业的智能化发展。
发明内容
有鉴于此,本发明的目的在于提供一种商品检索方法、装置及电子设备,以缓解目前新零售场景下的商品检索难度大的问题,能够更加有力的区分不同图像之间的不同,降低模型训练时对海量数据的依赖性,在提高图像检索精度的基础上,促进新零售行业的智能化发展。
第一方面,本发明实施例提供了一种商品检索方法,包括:
获取商品对应的待检索图像;
基于预训练的神经网络模型,提取所述待检索图像的待检索特征;
根据所述待检索图像的待检索特征,基于预先建立的商品特征库,进行商品检索;
其中所述商品特征库是基于所述预训练的神经网络模型,对旋转变换后的待提取图像进行特征提取而建立的。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述商品特征库的建立过程包括:
对于每种商品对应的待对比图像,对所述待对比图像进行补零处理,得到图像长度和宽度相等的第一图像;
对所述第一图像进行缩放操作,得到与预训练的神经网络模型相匹配的第二图像;
对所述第二图像进行旋转变换,得到多个待提取图像;
对待提取图像进行特征提取,获得待对比特征;
将每种商品对应的待对比特征进行存储,得到商品特征库。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述基于预训练的神经网络模型,提取所述待检索图像的待检索特征包括:
利用所述预训练的神经网络模型的卷积层,对所述待检索图像进行特征提取,获得第一特征图像;
对所述第一特征图像进行全局平均池化处理,得到待检索特征。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述基于预训练的神经网络模型,提取所述待检索图像的待检索特征包括:
利用所述预训练的神经网络模型的卷积层,对所述待检索图像进行特征提取,获得第一特征图像;
对所述第一特征图像进行全局平均池化处理,得到第一特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810999636.X/2.html,转载请声明来源钻瓜专利网。





