[发明专利]基于稀疏编码张量分解的动作识别方法有效

专利信息
申请号: 201610933077.3 申请日: 2016-10-24
公开(公告)号: CN106503659B 公开(公告)日: 2019-10-15
发明(设计)人: 苏育挺;徐传忠;张静 申请(专利权)人: 天津大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 杜文茹
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于稀疏编码张量分解的动作识别方法:将原始的视频序列表征为一个三阶的视频序列张量T表示视频序列长度,I1×I2表示视频帧的大小;对三阶的视频序列张量进行Tucker分解获得空域维度减少的核张量;将视频序列张量缩放到相同的尺度;动态学习上述过程更新结果直到算法收敛结果达到最优。本发明的基于稀疏编码张量分解的动作识别方法,能够将视频序列处理为统一的长度——稀疏编码张量分解技术。在这个过程中通过在张量分解的框架中适应性挑选出信息量最多的帧去构建出具有统一视频序列长度的新的视频序列。本发明的方法降低了手势识别的难度,提高了手势识别的准确性,为后续的视频序列分类提供了良好的条件,提升视频序列分类的准确率。
搜索关键词: 基于 稀疏 编码 张量 分解 动作 识别 方法
【主权项】:
1.一种基于稀疏编码张量分解的动作识别方法,其特征在于,包括如下步骤:1)将原始的视频序列表征为一个三阶的视频序列张量T表示视频序列长度,I1×I2表示视频帧的大小;2)对三阶的视频序列张量进行Tucker分解获得空域维度减少的核张量;3)将视频序列张量缩放到相同的尺度;包括:(1)构建目标函数为了将视频缩放到相同的尺度,对映射矩阵U3采用关键帧选择的措施:采用稀疏编码的方法从F中选取最优的K帧构成词典,其中K<T,在此基础上用有限的基重构原始的视频序列,对F按照时间域展开得到令张量展开矩阵设定目标函数如下:其中,定义词典为从F中选取的K帧向量构成的基,定义为表示去掉GS矩阵的全零列后构成的矩阵,λ,β为惩罚因子;同时可得:其中矩阵L通过初始化词典B={b1,…,bk…,bK}得到;目标函数转换如下形式:假定存在线性函数G=f(B),即满足G=BU3,则映射矩阵U3=B+G,其中B+为B的伪逆;(2)求解目标函数先应用词典学习的方法寻找最佳的关键帧构成词典B进而得到映射矩阵U3,再用交替迭代的方法得出映射矩阵U1和U2,最终得出等长的视频序列;具体包括(a)寻找最佳的关键帧构成词典B首先从张量展开矩阵中随机选择K列,组成初始化的词典B={b1,…,bk…,bK},并得到对角矩阵S和矩阵L,将原始的目标函数转化为求解如下目标函数:定义其中1≤k≤K,通过如下函数寻找使得误差最小的列从词典B中去掉该列得到其中1≤i≤T‑K,选择一个向量替换掉bp,使满足如下条件:更新、计算对角矩阵S和视频序列张量C,并重迭代(a)步直至收敛,利用映射矩阵U3=B+G得到映射矩阵U3;(b)求解映射矩阵U1和映射矩阵U2首先给定视频序列张量Α,随机初始化映射矩阵U1和映射矩阵U2,根据下式:F=Α×1U1×2U2           (9)对F展开得到矩阵利用视频序列张量C的算法求解映射矩阵U3,应用交替下降法以及特征值分解法将映射矩阵U1及映射矩阵U3作为已知求解映射矩阵U2,将映射矩阵U2及映射矩阵U3作为已知求解映射矩阵U1,重该迭代(b)步直至收敛;4)动态学习步骤2)和步骤3)更新结果直到算法收敛结果达到最优。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610933077.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top