[发明专利]一种视频特征提取方法在审
| 申请号: | 202111049463.3 | 申请日: | 2021-09-08 |
| 公开(公告)号: | CN113850158A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 李清;黄萍;黄安子 | 申请(专利权)人: | 深圳供电局有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/269;G06N3/04 |
| 代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 徐文城 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 特征 提取 方法 | ||
1.一种视频特征提取方法,其特征在于,包括:
获取视频帧图像,并抽取所述视频帧图像中的关键帧图像;
根据所述关键帧图像获得光流图像;
将所述关键帧图像和所述光流图像进行融合得到融合图像;
将所述融合图像输入预先训练好的CNN特征提取模型进行特征提取,获得视频特征。
2.根据权利要求1所述的视频特征提取方法,其特征在于,所述抽取所述视频帧图像中的关键帧图像,包括:
按照预设频率,周期性地从所述视频帧图像中抽取一帧图像作为关键帧图像。
3.根据权利要求1所述的视频特征提取方法,其特征在于,所述根据所述关键帧图像获得光流图像,包括:
在连续的10帧关键帧图像中,分别在前5帧图像中随机抽取1帧图像,在后5帧图像中随机抽取1帧图像,根据抽取的2帧图像关键帧图像获得光流的水平向量和垂直向量,将所述水平向量和垂直向量作为光流图像的第一维和第二维数据,并增加第三维数据,且将光流图像的第三维数据的数值设置为0,获得所述10帧关键帧图像所对应的光流图像。
4.根据权利要求3所述的视频特征提取方法,其特征在于,所述将所述关键帧图像和所述光流图像进行融合,包括:
将每一帧关键帧图像与其对应的光流图像的3维数值分别进行取均值,将均值作为融合图像的3维数值,获得融合图像。
5.根据权利要求1所述的视频特征提取方法,其特征在于,所述CNN特征提取模型包括Resnet-50结构,所述Resnet-50结构包括依次连接的输入层、layer0、layer1、layer2、layer3、layer4;
所述输入层用于对输入所述CNN特征提取模型的融合图像进行L2正则化;
所述layer0由一个核为7*7、步距为2的卷积层、一个BN层、一个Relu层以及一个3*3最大值池化、步长为2的池化层构成;
所述layer1包括依次连接的3个残差块,所述layer2包括依次连接的4个残差块,所述layer3包括依次连接的6个残差块,所述layer4包括依次连接的3个残差块。
6.根据权利要求5所述的视频特征提取方法,其特征在于,所述layer1~layer4的残差块均包括一个信道注意力模块、一个运动注意力模块以及依次连接的3个卷积模块,所述信道注意力模块用于提取输入残差块的图像的信道注意力特征获得一个信道注意力特征图,所述运动注意力模块用于提取输入残差块的图像的运动注意力特征获得一个运动注意力特征图,提取的所述信道注意力特征图和所述运动注意力特征图进行逐像素叠加后输入所述3个卷积模块依次进行卷积处理获得一个卷积特征图,并将所述卷积特征图与输入残差块的图像进行叠加后输出。
7.根据权利要求6所述的视频特征提取方法,其特征在于,所述layer1的3个卷积模块分别为64维的1*1卷积,64维的3*3卷积,以及256维的1*1卷积。
8.根据权利要求6所述的视频特征提取方法,其特征在于,所述layer2的3个卷积模块分别为128维的1*1卷积,128维的3*3卷积,以及512维的1*1卷积。
9.根据权利要求6所述的视频特征提取方法,其特征在于,所述layer3的3个卷积模块分别为256维的1*1卷积,256维的3*3卷积,以及1024维的1*1卷积。
10.根据权利要求6所述的视频特征提取方法,其特征在于,所述layer4的3个卷积模块分别为512维的1*1卷积,512维的3*3卷积,以及1024维的1*1卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111049463.3/1.html,转载请声明来源钻瓜专利网。





