[发明专利]一类基于张量自回归滑动平均模型的视频分类方法在审
| 申请号: | 202110028634.8 | 申请日: | 2021-01-08 |
| 公开(公告)号: | CN112801142A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 王少帆;邬玉洁;孔德慧;尹宝才 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06F16/75 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一类 基于 张量 回归 滑动 平均 模型 视频 分类 方法 | ||
1.一类基于张量自回归滑动平均模型的视频分类方法,其特征在于包括以下步骤:
步骤一:对待分类的原始视频数据进行张量表示,得到每段视频的视频序列张量;
步骤二:将每个视频序列张量编码成一个自回归滑动平均模型,进而求解得到模型中的参数,即核张量观测矩阵转移矩阵
步骤三:根据步骤二得到的模型参数,将每个待分类的原始视频数据表示为乘积格拉斯曼流形点,并在乘积格拉斯曼流形上计算每个待分类的原始视频数据到其他所有待分类的原始视频数据的距离:
步骤四:利用步骤三得到的距离进行视频分类。
2.根据权利要求1所述的一类基于张量自回归滑动平均模型的视频分类方法,其特征在于:步骤一所述的张量表示包括两种情况,即:
第一种情况:原始视频数据经过特征提取处理后转变为特征视频帧序列,直接将提取后的特征视频帧序列看作是一个三阶张量,张量的三个维度分别表示特征图像的宽度l1、高度l2和视频帧序列个数Z;
第二种情况:原始视频数据未经过处理,引入一个基于视频帧块的视频表示方法,具体为:首先对原始视频提取视频帧,将每个视频帧平均地分成大小相等的视频帧块,然后对每个视频帧的视频帧块采用GIST算子进行特征提取,每个视频帧形成一个特征矩阵,特征矩阵中的列向量对应视频帧块的特征;最后按照原始视频的时间顺序将所有特征矩阵排列构建成视频序列张量。
3.根据权利要求1所述的一类基于张量自回归滑动平均模型的视频分类方法,其特征在于:步骤二所述的自回归滑动平均模型建模过程如下:
将视频序列张量看作是一个ARMA模型的输出,对于n阶视频张量序列N表示视频序列总数目,构建自回归滑动平均模型:
其中,是n阶核张量,是满足列正交约束的观测矩阵,是满足列正交约束的转移矩阵,m表示观测矩阵和转移矩阵的个数,且满足m=n;
将模型转化成需要优化的目标函数:
4.根据权利要求3所述的一类基于张量自回归滑动平均模型的视频分类方法,其特征在于:步骤二所述的自回归滑动平均模型参数求解过程如下:
输入:N个n阶视频张量
输出:核张量观测矩阵转移矩阵
(1)、随机初始观测矩阵满足随机初始转移矩阵满足
(2)、循环求解D1,D2,D3,…,Dm,直到循环收敛:
结束循环;
(3)、计算核张量
(4)、循环求解E1,E2,E3,…,Em,直到循环收敛:
结束循环;
其中,SVD表示对矩阵做奇异值分解的函数,U称为左奇异矩阵,Σ称为奇异值,V称为右奇异矩阵,计算过程只用到了左奇异矩阵U,a(1),a(2),...,a(n)表示张量的模n展开,L1,L2,...,Ln表示核张量的大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110028634.8/1.html,转载请声明来源钻瓜专利网。





