[发明专利]一种无监督多视图特征选择的人体行为识别方法在审
申请号: | 201310557008.3 | 申请日: | 2013-11-11 |
公开(公告)号: | CN103577841A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 肖俊;冯银付;庄越挺;计明明;张鹿鸣 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种无监督多视图特征选择的人体行为识别方法。该方法首先对预先采集包含不同人体行为类型的视频数据集提取多种类型的视觉特征表达,得到多视图特征数据矩阵;接着对各个视图构建视图相关的视觉相似图和几何拉普拉斯矩阵,以此构建求解多视图特征选择矩阵与数据聚类类别矩阵的目标函数;然后采用迭代梯度下降法优化计算多视图特征选择矩阵,并依据 |
||
搜索关键词: | 一种 监督 视图 特征 选择 人体 行为 识别 方法 | ||
【主权项】:
1.一种无监督多视图特征选择的人体行为识别方法,其特征在于包括如下步骤:1)选用公共人体行为数据集KTH作为预先采集的包含不同人体行为类型的视频数据集,选用通过视频采集设备录取的人体行为视频作为待识别的人体行为视频;2)对预先采集的包含不同人体行为类型的视频数据集提取m种类型的视觉特征表达,得到该视频数据集所对应的多视图特征数据矩阵X=[X(1),X(2),...,X(m)]T,其中
是第v个视图下的特征数据矩阵,
是从第i个视频数据中提取的第v种类型的视觉特征表达,n是该视频数据集中所包含的视频数目;3)对任意第v个视图,构建该视图相关的视觉相似图A(v),定义如下:
其中,
表征第i个视频数据与第j个视频数据在第v个视图下的视觉相似性;4)对任意第v个视图,依据A(v)计算该视图下的几何拉普拉斯矩阵L(v),计算方法如下:L(v)=D(v)-A(v) 2其中,D(v)是对角矩阵,其对角位置i上的元素
5)根据X和L(v),构建求解多视图特征选择矩阵与数据聚类类别矩阵的目标函数如下:min F , λ v | v = 1 m , W tr ( F T Σ v = 1 m λ v r L ( v ) F ) + α | | X T W - F | | 2,1 + β | | W | | 2,1 s . t . F T F = I c , F ≥ 0 , Σ v = 1 m λ v = 1 , λ v ≥ 0 - - - 3 ]]> 在目标函数3中,F∈Rn×c是非负的数据聚类类别矩阵,c为数据聚类类别数目,r是开方次数常数,λv是第v个视图的权重系数,Ic∈Rc×c是单位矩阵,α和β为正则化系数,tr(·)为矩阵求迹函数,||·||2,1是矩阵的l2,1范数,对于任意矩阵B∈Rp×q,其l2,1范数| | B | | 2,1 = Σ i = 1 p Σ j = 1 q B ij 2 ; ]]> 6)采用迭代梯度下降求解方法优化求解上面的目标函数3,得到目标函数的局部最优解F,
和W;7)对多视图特征选择矩阵W,先按照行计算||Wi,:||,i∈{1,...,d},d为多视图特征数据矩阵X的行数,接着对所有行的计算结果进行降序排序,根据排序结果设置二值特征选择矩阵S如下:S=[s1,s2,...,sp]∈{0,1}d×p 4其中,si=[0,...,1,...,0]T∈Rd中值为1的位置对应于排序值为第i的W中的行号数,p为期望选择出的特征维数;8)对待识别的人体行为视频提取m种类型的视觉特征表达得到对应的多视图特征数据x=[(x(1))T,(x(2))T,...,(x(m))T]T,接着计算特征选择后的
与
X中各列数据的最小距离所对应的预先采集视频编号:j = arg min | | x ~ - X ~ : , j | | - - - 5 ]]> 将待识别的人体行为视频识别为预采集的第j个视频数据中的人体行为类型,从而实现无监督多视图特征选择的人体行为识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310557008.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种利用喷洒系统喷洒生物修复菌剂的方法
- 下一篇:注射用氨曲南组合物冻干粉针