[发明专利]一种视频交互式行为识别方法及装置有效
申请号: | 201910811059.1 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110717384B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 李岩山;郭天宇;周伟奇;刘星;刘瑜;王海鹏 | 申请(专利权)人: | 深圳大学;深圳市坪山区大数据资源管理中心 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06T5/30;G06T7/90 |
代理公司: | 北京东和长优知识产权代理事务所(普通合伙) 11564 | 代理人: | 周捷 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 交互式 行为 识别 方法 装置 | ||
1.一种视频交互式行为识别方法,其特征在于,所述方法包括:
步骤S201:在交互行为骨架序列数据集中标注主动参与者及被动参与者,对每个参与者Pi定义运动距离MD来衡量其在一个交互式行为中的运动量:
其中L代表运动序列的帧数,j代表第j个关节点,d(Pij,t,Pij,t+1)代表参与者Pi的关节点j在t帧和t+1帧之间的欧氏距离;将运动距离MD较大的参与者标注为主动参与者Pa,将另一参与者标注为被动参与者Pp;
步骤S202:对交互行为骨架序列,提取15个骨架关键关节点数据,计算相对距离特征向量;并对所述相对距离特征向量进行编码,得到表征所述交互式行为的骨架序列的彩色空间RGB图片;
步骤S203:对所述彩色空间RGB图片进行视觉增强处理,优化特征表示;
步骤S204:对所述彩色空间RGB图片利用3-stream神经网络识别所述交互式行为;
所述步骤S202:对交互行为骨架序列,提取15个骨架关键关节点数据,计算相对距离特征向量;并对所述相对距离特征向量进行编码,得到表征所述交互式行为的骨架序列的彩色空间RGB图片,包括:
定义表示参与者x在时刻t的关节i的三维坐标;所述参与者x包括主动参与者Pa及被动参与者Pp;
特征Fd(t)为所述主动参与者及被动参与者在关节点的帧内距离,其特征向量按公式(2)计算:
其中,i,j是两个参与者的任何关节,
特征Fm(t)为主动参与者和被动参与者的关节点的跨帧运动信息,其在时刻t到时刻t+T的关节移动距离特征向量按公式(3)计算:
其中,T是跨帧的间隔,
特征Fg(t)为主动参与者和被动参与者的关节点的相对于第一帧的全局信息,其在时刻t的关节全局距离特征向量按公式(4)计算:
将由公式(2)-(4)得到的特征Fd(t)、Fm(t)、Fg(t),对交互行为骨架序列的各个帧,将上述特征在每个帧内进行顺序连接,再将帧与帧之间逐帧进行连接,得到彩色空间RGB的数据值,再将所述彩色空间RGB的数据值归一化到[0,1]。
2.如权利要求1所述的视频交互式行为识别方法,其特征在于,所述15个骨架关键关节点包括:
头、颈、左肩、右肩、左肘、右肘、左手腕、右手腕、腰、左臀、右臀、左膝、右膝、左脚踝、右脚踝。
3.如权利要求1所述的视频交互式行为识别方法,其特征在于,所述步骤S203:对所述彩色空间RGB图片进行视觉增强处理,优化特征表示,包括:
基于数学形态学,使用形状探针探测所述彩色空间RGB图片,所述形状探针被称为结构化元素,所述结构化元素是一个二进制图像;
腐蚀操作符Θ定义为:
其中I是二值图像,E是结构化元素;对所述RGB图片应用腐蚀算子,采用公式(6)分别对RGB三通道进行腐蚀,得到视觉增强后的图像
其中IR、IG、IB代表腐蚀前所述RGB图片的三通道数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学;深圳市坪山区大数据资源管理中心,未经深圳大学;深圳市坪山区大数据资源管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910811059.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:遥感检测方法、装置和系统
- 下一篇:一种动态手势识别方法