[发明专利]基于层次信息传递的图片人体动作识别方法有效

专利信息
申请号: 201811085779.6 申请日: 2018-09-18
公开(公告)号: CN109214346B 公开(公告)日: 2022-03-29
发明(设计)人: 胡建芳;朱海昇;谢佳锋;郑伟诗 申请(专利权)人: 中山大学
主分类号: G06V40/20 分类号: G06V40/20;G06N3/04
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 层次 信息 传递 图片 人体 动作 识别 方法
【权利要求书】:

1.一种基于层次信息传递的图片人体动作识别方法,其特征在于,包括下述步骤:

S1、将人体分割为一个层次结构,该层次结构是自顶向下由粒度越来越细的局部身体区域构成,即将人体递归地分解为更小的身体部分;围绕这些身体部分,从图像中截取对应区域,利用卷积神经网络提取图像特征,具体为:

将人体层次分割标记为A={Hi},i=1,2,...,I,I是该人体层次分割的总层数,Hi表示第i层里身体部分的集合;由此可见,H1包含最大的身体部分,因此也是层次人体分割A的根结点;Hi里的每个节点可被分解为更小的部分,由此构成Hi+1里的结点;因此HI包含最小的身体部分;

S2、构建层次传播网络,递归地对步骤S1中层次结构的特征信息进行传递与整合,从而得到最终的动作描述子,具体为:

HI中结点的信息传递到HI-1中对应的父节点,形成位于该父节点位置的集成信息,这些集成信息又被传递至HI-2中对应的父节点上,在这种递归模式下,底层的信息最终被传播并集成到H1的根结点上,形成最终的动作描述子;

将Hi里的第j个结点标记为xij,将传递并集成于xij的信息标记为b(xij),则有:

其中xi+1,k表示Hi+1的第k个结点,Sij用于保证Hi+1中结点的信息只传递给对应的父节点,即,k∈Sij表示xi+1,k是由xij分割出来的子结点,mi+1表示Hi+1的聚合信息,K是Hi+1结点的个数,mi+1使得同一层级不同身体部位的结点之间的联系被捕捉,uij,vi+1,k与是模型的参数,分别用于结合来自当前的信息、来自其子结点的信息以及Hi+1的聚合信息,⊙表示对位乘法;

对于i=I有b(xIj)=uIj⊙xIj,至此所有b(xij)的递归定义完成了,每个结点都聚合了来自自身以及其子结点的信息,因此b(x11)编码了整个人体层次分割的上下文信息并生成了该人体的动作描述子;

S3、将步骤S2得到的动作描述子与额外的全图信息结合,输入最后的全连接层进行分类。

2.根据权利要求1所述基于层次信息传递的图片人体动作识别方法,其特征在于,步骤S3具体为:

数据集的动作类别共有C个,则全连接层有C个输出,分别代表该图像在每个动作类别上的分类置信度,接着使用sigmoid函数来计算该置信度的概率分布,用二元交叉熵来计算分类损失,从而对网络进行训练,在识别过程中,将概率最高的那个动作类别作为图像的动作类别,从而得到动作识别的最终结果。

3.根据权利要求2所述基于层次信息传递的图片人体动作识别方法,其特征在于,所述步骤S3中,进行分类的公式如下:

S=ΘT(wα⊙b(x11)+wβ⊙fI),

其中S就是分类的置信度,wα与wβ是可学习的模型参数,fI是原图的CNN特征,Θ是全连接层的参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811085779.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top