[发明专利]一种基于无标注自动特征提取的大规模电商图片检索系统在审
| 申请号: | 201711265073.3 | 申请日: | 2017-12-05 |
| 公开(公告)号: | CN107958067A | 公开(公告)日: | 2018-04-24 |
| 发明(设计)人: | 张杰;李仁勇;崇志宏 | 申请(专利权)人: | 焦点科技股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙)32249 | 代理人: | 陈建和 |
| 地址: | 210003 江苏省南京市高新*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 标注 自动 特征 提取 大规模 图片 检索系统 | ||
1.基于无标注自动特征提取的大规模电商图片检索系统,其特征是系统包含三个模块:特征提取模块,检索模块、以及图像数据库;
特征提取模块:特征提取模块包含两个部分,图像预处理和特征提取;由于输入的图像受到图像格式和图像像素大小的影响,先进行图像预处理操作;在本系统中图像预处理部分是对原始图像进行缩放和裁剪到相同的图像大小;对于单通道的灰度图将其转化为三通道的RGB三色图;并将0~255RGB值归一化到-0.5~+0.5区间;特征提取部分为基于深度神经网络的特征提取方式,提出使用一种无监督的深度模型作为图片的特征提取器;深度模型由两个深度神经网络组成,采样网络从随机噪声中采样生成与真实图片类似的伪造图片;判别网络接受真实图像数据和伪造数据作为输入并判别输入数据真伪,使用对抗训练交替优化两个网络,最后使用判别网络中的卷积层输出作为图像特征;
检索模块:对提取的原始特征在存储到图像数据库和检索之前进行特征降维,本系统使用机器学习中的PCA降维方法;进行检索时,将查询图像与数据库中所有图像匹配,计算图像特征间的欧几里得距离和夹角余弦距离,然后按距离排序返回检索结果。
2.根据权利要求1所述的检索系统,其特征是在训练模型阶段,首先从网站的商品图片中采样生成训练数据,用于模型的训练;特征提取网络一个是采样网络G和判别网络D;
采样网络的目标是学习关于图像数据的真实联合分布P,从而能采样生成新的伪造图像;判别网络其作用是通过观察到的图像输入来判定数据是属于真实图片的概率,类似一个二分类网络;采样网络总共5层,第一层是一个线性层,将噪声分布数据Z映射到4x 4x 512维,然后输入到反卷积层,反卷积核的参数设置均为5x5,步长为2,除最后一层输出层使用tanh激活函数外其他层均使用Relu激活;最后通过多层的反卷积,输出64x 64x 3数据;
判别网络是一个常见的4层卷积+1层全连接层的网络;判别网络中的采用带步长的卷积层替换池化层,卷积核参数设置与G网络一致,同时激活函数为Leakly-Relu,最后一层的激活函数为Sigmoid。
3.根据权利要求1所述的检索系统,其特征是通过交替的训练判别网络和采样网络,对于图像数据库中的每一张图片,进行图像特征预提取;系统使用判别网络的前四层提取图像的特征,然后对于提取到的8192维特征使用PCA降维到300维,并保存到特征数据库中;上述部分离线进行,从而确保检索过程的响应速度。
4.根据权利要求1所述的检索系统,其特征是当用户输入示例图片进行检索时,首先经过特征提取器提取图像的原始特征并降维,然后与图像特征库中数据进行相似匹配,采用两种距离度量方式即欧几里得距离和夹角余弦距离,得到图像数据库中按相似程度排序的检索结果。
5.根据权利要求1所述的检索系统,其特征是预先计算出所有图像的特征数据,并保存在图像特征库中;当查询提交时,直接将查询特征与图像库中的所有特征匹配,加快查询速度。
6.根据权利要求1所述的检索系统,其特征是当图像数据库更新时,只需要对图像特征库作相应更新。
7.根据权利要求2所述的检索系统,其特征是采样网络总共5层,第一层是一个线性层,将噪声分布数据Z映射到4x 4x 512维,然后输入到反卷积层,反卷积核的参数设置均为5x5,步长为2,除最后一层输出层使用tanh激活函数外其他层均使用Relu激活。最后通过多层的反卷积,输出64x 64x 3数据。判别网络是一个常见的4层卷积+1层全连接层的网络,与通常5层网络不同的是,判别网络中的采用带步长的卷积层替换池化层,卷积核参数设置与G网络一致,同时激活函数为Leakly-Relu,最后一层的激活函数为Sigmoid。判别网络的前四层卷积层可以视作图片的特征提取器,因此我们使用第四层卷积层的输出作为图像特征。
8.根据权利要求2所述的检索系统,其特征是通过交替的训练判别网络和采样网络,我们得到训练好的模型,然后对于图像数据库中的每一张图片,输入到判别网络提取特征;当得到所有图片的特征后再使用PCA降维方法对提取到的图像特征降维到300维,并保存到特征数据库中;上述过程离线进行。
9.根据权利要求2所述的检索系统,其特征是当用户输入示例图片进行检索时,首先经过特征提取器提取图像的原始特征,然后使用PCA降维,再与图像特征库中数据进行相似匹配,采用多种距离度量方式,得到图像数据库中按相似程度排序的检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711265073.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文档全自动拼接方法及系统
- 下一篇:一种基于实体知识库的语言模型平滑方法





