[发明专利]一种视频特征提取方法在审
| 申请号: | 202111049463.3 | 申请日: | 2021-09-08 |
| 公开(公告)号: | CN113850158A | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 李清;黄萍;黄安子 | 申请(专利权)人: | 深圳供电局有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T7/269;G06N3/04 |
| 代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 徐文城 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 特征 提取 方法 | ||
本发明涉及一种视频特征提取方法,包括:获取视频帧图像,并抽取所述视频帧图像中的关键帧图像;根据所述关键帧图像获得光流图像;将所述关键帧图像和所述光流图像进行融合得到融合图像;将所述融合图像输入预先训练好的CNN特征提取模型进行特征提取,获得视频特征。通过本发明,既能同时兼顾视频特征提取的有效性,又能很快速地完成视频特征提取。
技术领域
本发明涉及视频特征提取技术领域,具体涉及一种视频特征提取方法。
背景技术
视频特征提取的目的是帮助人们更加容易地找到感兴趣的视频,比如完成视频分类、视频理解、视频的目标跟踪、动作识别等,而如今视频的清晰度和规模越来越大,能稳定地对视频序列进行特征提取的方法变得越来越重要。
目前,基于图像的视频特征提取方法对于时间特征的利用非常有限,并且受外界干扰(如遮挡、光照、目标移动速率)的影响非常大,准确性往往在实际应用场景中鲁棒性不强。而结合机器学习和图像的一些统计特征,例如HoG特征、HoF特征,进行视频特征提取能取得相对较好的效果,但是在提取效率上非常有限,速度较慢。
因此,亟待提出一种既能同时兼顾视频特征提取的有效性,又能很快速地完成特征提取的方法/系统。
发明内容
本发明的目的在于提出一种视频特征提取方法,既能同时兼顾视频特征提取的有效性,又能很快速地完成视频特征提取。
为实现上述目的,本发明实施例提出一种视频特征提取方法,包括:
获取视频帧图像,并抽取所述视频帧图像中的关键帧图像;
根据所述关键帧图像获得光流图像;
将所述关键帧图像和所述光流图像进行融合得到融合图像;
将所述融合图像输入预先训练好的CNN特征提取模型进行特征提取,获得视频特征。
优选地,所述抽取所述视频帧图像中的关键帧图像,包括:
按照预设频率,周期性地从所述视频帧图像中抽取一帧图像作为关键帧图像。
优选地,所述根据所述关键帧图像获得光流图像,包括:
在连续的10帧关键帧图像中,分别在前5帧图像中随机抽取1帧图像,在后5帧图像中随机抽取1帧图像,根据抽取的2帧图像关键帧图像获得光流的水平向量和垂直向量,将所述水平向量和垂直向量作为光流图像的第一维和第二维数据,并增加第三维数据,且将光流图像的第三维数据的数值设置为0,获得所述10帧关键帧图像所对应的光流图像。
优选地,所述将所述关键帧图像和所述光流图像进行融合,包括:
将每一帧关键帧图像与其对应的光流图像的3维数值分别进行取均值,将均值作为融合图像的3维数值,获得融合图像。
优选地,所述CNN特征提取模型包括Resnet-50结构,所述Resnet-50结构包括依次连接的输入层、layer0、layer1、layer2、layer3、layer4;
所述输入层用于对输入所述CNN特征提取模型的融合图像进行L2正则化;
所述layer0由一个核为7*7、步距为2的卷积层、一个BN层、一个Relu层以及一个3*3最大值池化、步长为2的池化层构成;
所述layer1包括依次连接的3个残差块,所述layer2包括依次连接的4个残差块,所述layer3包括依次连接的6个残差块,所述layer4包括依次连接的3个残差块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111049463.3/2.html,转载请声明来源钻瓜专利网。





