[发明专利]行为识别方法及装置、设备和存储介质在审
申请号: | 202110447987.1 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113111838A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 苏海昇;王栋梁 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 马丽;张颖玲 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为 识别 方法 装置 设备 存储 介质 | ||
1.一种行为识别方法,其特征在于,所述方法包括:
获取待识别视频序列中每一帧图像中每一对象的检测结果;其中,所述待识别视频序列中包括单个对象和/或群体对象;所述群体对象中包括空间距离小于距离阈值的至少两个对象;
根据每一所述对象的检测结果,生成至少一个第一序列和/或至少一个第二序列,其中,每一所述第一序列和每一所述第二序列均包括以下之一:同一所述单个对象、所述群体对象;
利用已训练的多任务识别网络模型,分别对每一所述第一序列和/或每一所述第二序列进行行为识别,得到每一所述单个对象的行为识别结果和/或所述群体对象的行为识别结果。
2.如权利要求1所述的方法,其特征在于,所述对象的检测结果至少包括所述对象的检测框和与所述检测框关联的对象标识;
所述根据每一所述对象的检测结果,生成至少一个第一序列,包括:
根据每一所述对象的检测框在所在对应帧图像中的分布情况,确定所述每一帧图像中的稀疏检测框;其中,所述稀疏检测框与所述每一帧图像中除所述稀疏检测框之外的其他检测框之间的重叠次数小于第一次数阈值;
根据所述每一帧图像中的稀疏检测框和与所述稀疏检测框关联的对象标识,生成所述至少一个第一序列。
3.如权利要求2所述的方法,其特征在于,所述根据每一所述对象的检测结果,生成至少一个第二序列,包括:
根据每一所述对象的检测框在所在对应帧图像中的分布情况,确定所述每一帧图像中的密集检测框;其中,所述密集检测框与所述每一帧图像中除所述密集检测框之外的其他检测框之间的重叠次数大于等于第二次数阈值;所述第二次数阈值大于所述第一次数阈值;
根据所述每一帧图像中的密集检测框和与所述密集检测框关联的对象标识,生成所述至少一个第二序列。
4.如权利要求2或3所述的方法,其特征在于,所述根据每一所述对象的检测框在所在对应帧图像中的分布情况,确定所述每一帧图像中的稀疏检测框,包括:
确定所述每一帧图像所包括的检测框的数量;
在所述检测框的数量为1的情况下,将该检测框确定对应帧图像中的稀疏检测框。
5.如权利要求3所述的方法,其特征在于,所述根据每一所述对象的检测框在所在对应帧图像中的分布情况,确定所述每一帧图像中的稀疏检测框和密集检测框,包括:
确定所述每一帧图像所包括的检测框的数量;
在所述检测框的数量大于等于2的情况下,根据所述每一帧图像中每两个检测框之间的交并比,生成所述每一帧图像对应的邻接矩阵;
将所述邻接矩阵中匹配次数为零的检测框作为所述每一帧图像中的稀疏检测框;
将所述邻接矩阵中匹配次数大于等于第三次数阈值的检测框作为所述每一帧图像中的密集检测框;其中,所述第三次数阈值大于所述第二次数阈值。
6.如权利要求2至5任一项所述的方法,其特征在于,所述待识别视频序列是由帧序列缓冲区中的帧图像组成的,所述根据所述每一帧图像中的稀疏检测框和与所述稀疏检测框关联的对象标识,生成所述至少一个第一序列,包括:
针对所述帧序列缓冲区的所有帧图像,对与每一所述对象标识关联的稀疏检测框在空间位置上取并集,得到与每一所述对象标识对应的单个对象的最小包围框;
按照所述最小包围框的尺寸大小,截取所述每一帧图像中与所述最小包围框的空间位置对应的第一区域图像;
按照所述每一帧图像的时间戳,依次连接所述第一区域图像,得到与每一所述对象标识对应的第一序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110447987.1/1.html,转载请声明来源钻瓜专利网。