[发明专利]基于稀疏编码张量分解的动作识别方法有效
| 申请号: | 201610933077.3 | 申请日: | 2016-10-24 |
| 公开(公告)号: | CN106503659B | 公开(公告)日: | 2019-10-15 |
| 发明(设计)人: | 苏育挺;徐传忠;张静 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: |
一种基于稀疏编码张量分解的动作识别方法:将原始的视频序列表征为一个三阶的视频序列张量 |
||
| 搜索关键词: | 基于 稀疏 编码 张量 分解 动作 识别 方法 | ||
【主权项】:
1.一种基于稀疏编码张量分解的动作识别方法,其特征在于,包括如下步骤:1)将原始的视频序列表征为一个三阶的视频序列张量
T表示视频序列长度,I1×I2表示视频帧的大小;2)对三阶的视频序列张量
进行Tucker分解获得空域维度减少的核张量;3)将视频序列张量缩放到相同的尺度;包括:(1)构建目标函数为了将视频缩放到相同的尺度,对映射矩阵U3采用关键帧选择的措施:采用稀疏编码的方法从F中选取最优的K帧构成词典,其中K<T,在此基础上用有限的基重构原始的视频序列,对F按照时间域展开得到
令张量展开矩阵
设定目标函数如下:
其中,定义词典
为从F中选取的K帧向量构成的基,定义为![]()
表示去掉GS矩阵的全零列后构成的矩阵,λ,β为惩罚因子;同时可得:
其中矩阵L通过初始化词典B={b1,…,bk…,bK}得到;目标函数转换如下形式:
假定存在线性函数G=f(B),即满足G=BU3,则映射矩阵U3=B+G,其中B+为B的伪逆;(2)求解目标函数先应用词典学习的方法寻找最佳的关键帧构成词典B进而得到映射矩阵U3,再用交替迭代的方法得出映射矩阵U1和U2,最终得出等长的视频序列;具体包括(a)寻找最佳的关键帧构成词典B首先从张量展开矩阵
中随机选择K列,组成初始化的词典B={b1,…,bk…,bK},并得到对角矩阵S和矩阵L,将原始的目标函数转化为求解如下目标函数:
定义
其中1≤k≤K,通过如下函数寻找使得误差最小的列
从词典B中去掉该列得到
令
其中1≤i≤T‑K,选择一个向量
替换掉bp,使
满足如下条件:
更新、计算对角矩阵S和视频序列张量C,并重迭代(a)步直至收敛,利用映射矩阵U3=B+G得到映射矩阵U3;(b)求解映射矩阵U1和映射矩阵U2首先给定视频序列张量Α,随机初始化映射矩阵U1和映射矩阵U2,根据下式:F=Α×1U1×2U2 (9)对F展开得到矩阵
利用视频序列张量C的算法求解映射矩阵U3,应用交替下降法以及特征值分解法将映射矩阵U1及映射矩阵U3作为已知求解映射矩阵U2,将映射矩阵U2及映射矩阵U3作为已知求解映射矩阵U1,重该迭代(b)步直至收敛;4)动态学习步骤2)和步骤3)更新结果直到算法收敛结果达到最优。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610933077.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种长寿药酒及其制备方法
- 下一篇:微米香砂六君子散剂的制备方法





