[发明专利]基于语义级领域不变特征的跨域人体动作识别方法有效
申请号: | 202110818612.1 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113657172B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 陈万军;刘龙;范凤梅 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/40;G06V10/774;G06V10/80 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 杨洲 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 领域 不变 特征 人体 动作 识别 方法 | ||
1.基于语义级领域不变特征的跨域人体动作识别方法,其特征在于,利用由2个分类器构成的并行分类对抗学习网络架构来引导特征提取器从输入数据中提取具有领域不变性的语义级特征,提高跨域人体动作识别模型的分类性能;
具体步骤如下:
步骤1:输入RGB帧序列:
从有标签的源域与无标签的目标域数据集中输入RGB帧序列数据Xi,源域样本数为Ns,目标域样本数为NT,i=1,2,…,Ns∪T,源域数据对应的标签为yj,j=1,2,…,Ns;
步骤2:帧级特征提取:
帧级特征提取模块由通用特征提取子网络和动作识别特定任务特征变换子网络组成,从输入的帧序列中提取帧级特征G(Xi),G()表示特征提取模块;
步骤3:特征时空聚集:
沿时间维度对提取的空间帧级特征进行均值池化聚集,形成视频级特征为第i个视频样本的特征序列的第t个等间隔采样帧,τ=5为对每个样本的等间隔采样帧数;
步骤4:领域适配对抗学习模块:
对抗学习模块表示为D(),该模块由梯度反转层、域判别层和批归一化层组成,从该模块的输出来计算域对抗损失:
CE(·,·)为交叉熵损失函数,di为领域标签,当fi来自源域时di=0,当fi来自目标域时di=1;
步骤5:分类器:
(5a)分类器由2个并行的分支构成:分类器1和分类器2,分别表示为C1()和C2();这2个分类器具有相同的网络结构;p(1)、p(2)分别为分类器1和分类器2的输出结果,p=(p(1)+p(2))/2为分类器对样本Xi的最终预测结果;从分类器的预测结果中计算有标签的源域样本数据的分类损失
(5b)对分类器1和分类器2的权值矩阵按列展开成向量,分别表示为w(1)和w(2),计算分类器差异化损失:
步骤6:训练基于语义级领域不变特征的跨域人体动作识别模型:
(6a)计算模型的训练损失L=Lc+αLdiff-βLadv,α,β的值分别设置为0.01和0.005;
(6b)利用随机梯度下降算法训练特征变换子网络、领域适配对抗学习模块、分类器1和分类器2;
步骤7:对目标域中的数据进行分类:
(7a)将目标域中的待分类样本XT输入到帧级特征提取器中,得到帧级特征G(XT);
(7b)对帧级特征进行时空聚集,得到视频级特征fT;
(7c)将fT分别输入到分类器1和分类器2中,将两个分类器的输出结果进行均值融合后得到最终的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110818612.1/1.html,转载请声明来源钻瓜专利网。