首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]基于近邻结构保持的哈希学习方法和装置有效

申请号：	201910264740.9	申请日：	2019-04-03
公开（公告）号：	CN110069666B	公开（公告）日：	2021-04-06
发明（设计）人：	鲁继文;周杰;李舒燕	申请（专利权）人：	清华大学
主分类号：	G06F16/783	分类号：	G06F16/783;G06F16/75
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	张润
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于近邻结构保持学习方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于近邻结构保持的哈希学习方法，其特征在于，所述方法包括以下步骤：

S1、获取视频训练集，针对所述视频训练集中的每个训练视频，提取所述每个训练视频的M个帧级特征；

S2、采用自动编码器，提取每个训练视频的时域外观特征，并对所述时域外观特征进行聚类，得到锚点特征集合；

S3、针对每个训练视频，从所述锚点特征集合中获取每个训练视频对应的时域外观近邻特征；

S4、采用编码网络，根据所述时域外观近邻特征，将每个训练视频编码为对应的深度表达；

S5、根据使用激活函数的全链接层，将所述每个训练视频对应的深度表达，转化为一列二值码；

S6、采用译码网络，根据所述二值码重构出每个训练视频对应的M个重构帧级特征；

S7、根据每个训练视频对应的所述帧级特征和所述重构帧级特征，生成重构误差函数，并根据所述时域外观特征和所述二值码，生成近邻相似性误差函数；

S8、对网络进行训练，以使所述重构误差函数最小化，以及使所述近邻相似性误差函数最小化；其中，所述网络包括所述编码网络、所述全链接层和所述译码网络。

2.根据权利要求1所述的方法，其特征在于，每个训练视频具有a个时域外观近邻特征，分别为其中，i＝1，2，3，…，N，N为所述视频训练集中训练视频的个数；步骤S4具体包括：

S41、将每个训练视频对应的a个时域外观近邻特征，列向合并得到第一向量

S42、将所述第一向量映射为b维的近邻结构表达n_i，其中，FC表示全链接层映射；

S43、针对每个训练视频，在第一个时刻，将每个训练视频的第一帧帧级特征输入至所述编码网络，并将近邻结构表达n_i以如下方式嵌入至b维的记忆状态中：

其中，d为固定值，W^q、W^k、W^v为编码网络的参数值，表示列向合并，表示对应训练视频的第一个时刻输入的帧级特征，m_i,1表示第一个时刻对应的记忆状态；

S44、当有新的帧级特征输入至编码网络时，记忆状态按照如下方式进行更新：

其中，1t≤M，表示第t个时刻输入的帧级特征，m_i,t表示第t个时刻对应的记忆状态，m_i,t-1表示第t-1个时刻对应的记忆状态；

所述编码网络为LSTM网络，所述编码网络中的各个运算单元为：

其中，MLP表示多层映射，BN表示批规范化，W^iv、W^ih、W^fv、W^fh、W^ov、W^oh表示所述编码网络的参数值，⊙表示内积；其中，σ函数的计算方式为σ(x)＝1/(1+e^-x)；h_i,t-1表示第t-1时刻隐层的输出、h_it表示第t时刻隐层的输出；

S45，将最后一个时刻所得的隐层输出h_i,M，作为对应训练视频的深度表达；

其中，表示对应训练视频的帧级特征，θ表示编码网络的参数。

3.根据权利要求2所述的方法，其特征在于，根据使用激活函数的全链接层，将对应训练视频的深度表达进行转化，得到的一列二值码为：

b_i＝sgn(t_i)；

其中，t_i＝FC(h_i,M,k)；FC表示全链接层映射，sgn表示符号函数，当t_i大于0时，sgn(t_i)为1，当t_i小于或等于0时，sgn(t_i)为-1，k表示所述一列二值码的长度。

4.根据权利要求1所述的方法，其特征在于，所述视频训练集中包括N个训练视频，

所述重构误差函数为：

其中，表示第i个训练视频中的第m个帧级特征，表示第i个训练视频中的第m个重构帧级特征，l表示帧级特征的维度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910264740.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种筛选项的提供方法、客户端及服务器
下一篇：一种搜索方法、装置以及用于搜索的装置

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top