[发明专利]一种视频时序动作的检测方法、装置及设备有效
| 申请号: | 202110861491.9 | 申请日: | 2021-07-29 |
| 公开(公告)号: | CN113609948B | 公开(公告)日: | 2023-09-05 |
| 发明(设计)人: | 杜吉祥;彭肖肖;张洪博;翟传敏;雷庆 | 申请(专利权)人: | 华侨大学 |
| 主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/62;G06V10/762;G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06N3/045;G06N3/0464;G06N3/094 |
| 代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 郭福利 |
| 地址: | 361000 *** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 时序 动作 检测 方法 装置 设备 | ||
1.一种视频时序动作的检测方法,其特征在于,包括:
获取视频数据,并提取所述视频数据的视频特征;
将所述视频特征输入至锚分支网络以及无锚分支网络,以获取所述锚分支网络输出的第一输出结果,及所述无锚分支网络输出的第二输出结果,其中,所述锚分支网络以及所述无锚分支网络并行处理所述视频特征;
调用对齐损失函数对所述第一输出结果及所述第二输出结果进行融合处理,生成时序动作定位结果集;具体为:
调用无锚目标检测算法,对所述视频特征进行区分为前景点和背景点;
获取被判定为前景点的时序点的分类分数,以及该时序点到动作边界的距离;
锚匹配网络是一个多任务网络,其损失函数为多任务损失函数,包括锚分支损失函数、无锚分支损失函数和两个分支的对齐损失函数,其数学表达式如下:
LAPMN=Lab+λ·Laf+γ·Lal
其中,LAPMN是总损失函数,Lab损失函数是锚分支损失函数,用于监督锚分支网络中定位和分类任务的训练,Laf损失函数是无锚分支损失函数,用于监督无锚分支网络的定位和分类任务,Lal损失函数是对齐损失函数,
其中,对齐损失函数的模型为:
其中,Lal为对齐损失函数,为锚分支网络输出的动作提名,为无锚分支网络输出的动作提名,N为常数;
其中,锚分支网络和无锚分支网络共享时序位置点,所述时序位置点包括前景点和背景点,对齐损失函数的模型用于对前景点计算损失,其中N表示两个分支按照回归分数排序得到的TopN个时序提名的个数,对两个分支的TopN个时序提名,逐个计算它们之间的时序交并比tIoU;
其中,将视频特征输入到锚匹配网络中,并从锚分支网络和无锚分支网络进行预测,对于锚分支网络,得到分类分数Sab、动作提名评价分数po和动作边界偏移值(Δc,Δw),对无锚分支网络,将网络输出的偏移值转化成标准的动作边界(saf,eaf),将两个分支得到的输出结果进行融合,然后,使用Soft-NMS算法对两个分支的融合结果进行后处理,最后得到时序动作定位结果集。
2.根据权利要求1所述的一种视频时序动作的检测方法,其特征在于,所述获取视频数据,并提取所述视频数据的视频特征,具体为:
以预设的帧率对所述视频数据进行拆解,以获得所述视频数据的视频帧序列;
调用光流算法运算所述视频数据,以提取出所述视频数据的光流图像;
调用经过预训练的I3D模型,将所述视频帧序列及所述光流图像分别输入至所述I3D模型中,以获得对应的RGB特征和Flow特征;
将所述RGB特征和Flow特征进行拼接,生成所述视频特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110861491.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种接线盒
- 下一篇:一种可快速疏散内部热量的自动化电气控制箱





