[发明专利]一种训练和计算相似性哈希码的神经网络方法在审
申请号: | 202011469440.3 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112560942A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 张勇;朱立松 | 申请(专利权)人: | 央视国际网络无锡有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214000 江苏省无锡市新区震泽路1*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 计算 相似性 哈希码 神经网络 方法 | ||
本发明涉及计算机处理技术领域,具体涉及一种训练和计算相似性哈希码的神经网络方法,旨在解决现有技术中在实际情况中效果不佳的问题,其技术要点在于:包含以下步骤:S1:使用一个神经网络将一个高维空间的向量z映射为低维空间的向量x;S2:确定该神经网络的参数θ;S3:使用神经网络f(*|θ)计算相似性哈希码,即强迫输出的值只取0/1二值。本申请所提供的一种训练和计算相似性哈希码的神经网络方法,解决了只采用线性变换时效果不佳的问题,适用范围更加广泛,不只局限于图像,处理图像时不依赖于手工设计的SIFT或SURF特征,速度更快,而且可以使用GPU进一步加速。
技术领域
本发明涉及计算机处理技术领域,具体涉及一种训练和计算相似性哈希码的神经网络方法。
背景技术
2010年以色列研究学者发表的论文”The Video Genome”首次提出了视频基因的概念。该论文提出了对于一张图片(或者图像帧)首先提取它的SIFT特征,SIFT特征是一个128维的向量。通过对大量的图像抽取SIFT特征就可以得到大量的SIFT特征点数据,然后利用这些SIFT特征数据通过聚类算法找到 2048个聚类中心,将聚类中心作为量化中心点。
然后对于任意一副图像,都可以将SIFT特征向量量化到其中一个聚类中心点。论文中提出将图像分为左上、右上、左下、右下四个区域,在每一个区域中,对落入每一个聚类中心点的SIFT特征进行计数就可以得到2048维的特征向量,四个区域合起来可以得到2048*4=8192维的特征向量,这个特征向量就称为图像的基因码。
下一步计算相似性哈希码是最为关键的一步。作者提出要将该8192维的高维特征向量降低为64维相似性哈希码,所谓相似性哈希码是指如果两幅图像是相似的,那么它们俩的相似性哈希码应之间的汉明距离应小于d0,如果两幅图像不相似它们的哈希码的汉明距离应大于d0。论文作者提出的方法是用一个线性变换将8192维向量降低至64维向量,如下面公式所示:
x=sign(Az+b) (1)
其中z表示8192维的高维特征向量,x表示64维的相似性哈希码,哈希码的取值只有0或1,sign表示符号函数,当输入值大于等于零时取1,当输入值小于零时取0。于是问题的关键就在于怎么取A和b这两个参数了。论文中提出了A和b参数的设置应使得下面的目标函数最小。
其中dA,b(x,x/)表示在A,b参数下计算x和x/之间的汉明距离。但是,实际操作过程中,较难确定公式(1)的A和b两个参数,且同时由于采用的是简单的线性变换,所以在实际情况中效果不佳。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中在实际情况中效果不佳的缺陷,从而提供一种训练和计算相似性哈希码的神经网络方法。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种训练和计算相似性哈希码的神经网络方法,包含以下步骤:
S1:使用一个神经网络将一个高位空间的向量z映射为低维空间的向量x;
S2:确定该神经网络的参数θ;
S3:使用神经网络f(*|θ)计算相似性哈希码,即强迫输出的值只取0/1二值。
优选的,所述S2中包含以下公式:
其中,
公式中:表示对向量x的所有纬度求和得到一个标量。将输出的p作为向量z和z/是否相似的概率;所述α是一个常数,用来调控sigmoid函数在0附近的斜率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络无锡有限公司,未经央视国际网络无锡有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011469440.3/2.html,转载请声明来源钻瓜专利网。