[发明专利]基于捷径深度神经网络的视频分类方法有效
申请号: | 201510280574.3 | 申请日: | 2015-05-27 |
公开(公告)号: | CN104881685B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 靳晓明;万程 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/78 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 捷径 深度 神经网络 视频 分类 方法 | ||
1.一种基于捷径深度神经网络的视频分类方法,其特征在于,所述捷径深度神经网络包括:第一输入层、第二输入层、开关节点层、多个隐藏层和一个输出层,所述第一输入层、所述多个隐藏层和所述输出层依次相连,所述第二输入层通过所述开关节点层与所述多个隐藏层相连,所述第一输入层、第二输入层、开关节点层、多个隐藏层和一个输出层分别设有预定的节点数,所述方法包括:
训练分类器的步骤,包括:获取训练数据的类别标签,并从所述训练数据中提取视频特征和异构特征,并设定开关节点数值,以及将所述训练数据的类别标签、视频特征和异构特征输入所述捷径深度神经网络,以训练得到用于对视频进行分类的分类器,所述视频的类别由所述类别标签表示;
视频分类的步骤,包括:获取测试数据,并从所述测试数据中提取视频特征和异构特征,并将所述测试数据的视频特征和异构特征输入所述分类器,以得到所述测试数据对应的类别标签;
其中,所述视频特征由所述第一输入层输入,并依次通过所述多个隐藏层进行训练,所述异构特征由所述第二输入层输入,并根据所述开关节点数值通过相应的隐藏层进行训练。
2.根据权利要求1所述的基于捷径深度神经网络的视频分类方法,其特征在于,根据PCA方法提取所述视频特征,根据LDA方法提取所述异构特征。
3.根据权利要求1所述的基于捷径深度神经网络的视频分类方法,其特征在于,在得到所述分类器之后,还包括:利用BP算法对所述分类器进行优化。
4.根据权利要求1所述的基于捷径深度神经网络的视频分类方法,其特征在于,所述训练分类器的步骤,具体包括:
S1:获取所述视频特征和异构特征,其中,所述视频特征和所述异构特征为1000维的向量,所述视频特征和所述异构特征表示为:
S2:设定开关节点数值,其中,开关节点结构为矩阵Z∈{0,1}3×1000,如果隐藏层i3与异构特征aj连结,则令否则令且j=1,2,…,1000;
S3:随机初始化第一输入层与第一隐藏层之间的权值矩阵第一输入层偏置向量隐藏层偏置向量第二输入层与第一隐藏层之间的权值矩第二输入层偏置向量
S4:将所述v,a输入到所述捷径深度神经网络网络中,并计算所述多个隐藏层的节点激活概率值;
S5:根据隐藏层的节点的激活概率值对所述隐藏层节点进行抽样得到h(0),并根据抽取出的样本计算重构输入层的概率值,其中,h(0)表示隐藏层节点初次抽样结果;
S6:根据所述重构输入层的概率值对重构输入层进行抽样得到v(1)、a(1),并根据所述v(1)和a(1)重复S4和S5,得到h(1);其中,重构输入层是根据h(0)计算得到的;h(1)为隐藏层节点第二次抽样结果,v(1)为视频特征第二次抽样结果;a(1)为异构特征第二次抽样结果;
S7:计算参数的梯度;
S8:每计算预定数量的梯度,对所述参数进行更新,直到所有训练数据处理完成;
S9:重复所述S4至所述S8预定次数;
S10:对于剩余的第二和第三隐藏层,将前一层网络的输出值作为所述第一输入层的输入,所述第二输入层的输入不变,根据所述S3至S9进行训练;
S11:利用BP算法对所述捷径深度神经网络进行微调。
5.根据权利要求4所述的基于捷径深度神经网络的视频分类方法,其特征在于,将所述v,a输入到所述捷径深度神经网络网络中,并通过如下公式计算所述多个隐藏层的节点激活概率值,所述公式为:
其中,σ表示logistic函数W·i表示第一输入层与第一隐藏层之间的权值矩阵W的第i个列向量,W′·i为第二输入层与第一隐藏层之间的权值矩阵第i个列向量;Z1·为开关节点结构矩阵第1个行向量,且i=1,2,…,500。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510280574.3/1.html,转载请声明来源钻瓜专利网。