[发明专利]基于时间一致性对比学习的动作规范性检测方法和装置在审
申请号: | 202210454687.0 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114648723A | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李玲;徐晓刚;王军;祝敏航;曹卫强;何鹏飞 | 申请(专利权)人: | 之江实验室;浙江工商大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V20/52;G06N3/04;G06N3/08 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 311100 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 一致性 对比 学习 动作 规范性 检测 方法 装置 | ||
1.一种基于时间一致性对比学习的动作规范性检测方法,其特征在于,包括以下步骤:
步骤一,构建第一数量标注和第二数量未标注的摄像头采集视频的数据集,第一数量小于第二数量;
步骤二,对第二数量未标注视频数据进行强、弱增强处理,分别得到强、弱增强数据;
步骤三,将强、弱增强数据输入自编码特征提取网络中提取出强、弱增强数据的特征;
步骤四,将强、弱增强数据的特征输入时间一致性行为动作对齐网络,得到强、弱增强图像特征,后在由强、弱增强图像特征构成的图像特征序列对间查找相似动作最近邻帧并对齐,得到图像特征序列对间相似动作起始帧和结束帧集合;
步骤五,将强、弱增强图像特征和图像特征序列对间相似动作起始帧和结束帧集合输入时空判别性特征提取网络,结合对比学习网络,完成对第二数量未标注视频数据的自监督预训练;
步骤六,利用自监督预训练后的自编码特征提取网络参数,在自编码特征提取网络后加入分类网络,然后采用第一数量标注视频数据完成网络迁移学习,最后通过视频帧间行为类别的变化判断视频图像的动作规范性。
2.如权利要求1所述的基于时间一致性对比学习的动作规范性检测方法,其特征在于,所述步骤二具体为:
设无剪切视频数据为,为第i帧视频,为总的视频帧数,从视频
其中,其中弱数据增强方式为颜色增强结合尺度变换,强数据增强方式为视频片段置换结合尺度变换;视频片段置换为:将视频分割为不大于M的任意段,且随机打乱分割后的片段。
3.如权利要求2所述的基于时间一致性对比学习的动作规范性检测方法,其特征在于,所述步骤三具体为:
使用3D ResNet50作为自编码器即自编码特征提取网络,将和经过3DResNet50自编码器,映射得到高维特征,其中表示或,,为3D ResNet50函数,,为输出特征向量维度,即通过自编码器后分别得到强增强数据的特征和弱增强数据的特征。
4.如权利要求3所述的基于时间一致性对比学习的动作规范性检测方法,其特征在于,所述步骤四包括以下子步骤:
步骤4.1,将强增强数据的特征和弱增强数据的特征经过时空全局平均池化层、全连接层和卷积层,输出图像特征序列和,其中为第i帧强增强图像特征,为第i帧弱增强图像特征;
步骤4.2,对于步骤4.1输出的图像特征序列和,所述的图像特征序列在彼此间查找相似动作最近邻帧,首先计算第i帧强增强图像特征在中的最近邻帧,得到后再反向计算在中的最近邻帧,若i=k则图像特征序列对间相似动作对齐成功;为计算损失函数,将中第i帧标记为1,其余帧标记为0,预测值,其中,, 表示图像特征序列中的第k帧强增强图像特征,并利用交叉熵损失函数计算预测值与真实标签之间的损失:
, ,
,
其中和分别表示图像特征序列中的第j和k帧弱增强图像特征,表示和间的相似度度量函数, 表示真实标签, 表示预测值;
步骤4.3,将步骤4.2中图像特征序列对中i=k的特征位置进行记录,针对输入图像特征序列对,记录i=k位置组成相似动作起始帧集合和动作结束帧集合,其中N为对齐成功的图像特征序列对数,和分别表示图像特征序列对齐起始位置,和分别表示图像特征序列对齐结束位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;浙江工商大学,未经之江实验室;浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210454687.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种缸压油与弹簧组合式二级调速旋转中心轴
- 下一篇:一种裸花紫珠扦插种植方法