[发明专利]一种基于优化视频关键帧提取的短视频分类方法及系统在审
申请号: | 201911420703.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111079864A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 刘昱龙;范俊;顾湘余;李文杰 | 申请(专利权)人: | 杭州趣维科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06F16/75 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 贺龙萍 |
地址: | 310012 浙江省杭州市西湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优化 视频 关键 提取 分类 方法 系统 | ||
1.一种基于优化视频关键帧提取的短视频分类方法,其特征在于,包括步骤:
S1、提取短视频密集帧;
S2、计算所述密集帧中各图像帧的信息量;
S3、选取信息量最大的多个图像帧作为所述短视频的关键帧;
S4、拼接所述关键帧生成短视频张量,将所述短视频张量输入3D-CNN分类模型,基于所述3D-CNN分类模型对所述短视频张量进行特征学习,输出短视频类别。
2.根据权利要求1所述的短视频分类方法,其特征在于,所述密集帧的数量为所述关键帧数量的m倍,m≥2。
3.根据权利要求1所述的短视频分类方法,其特征在于,所述步骤S2具体为:
S21、对密集帧中各图像帧进行灰度化,彩色图像三个颜色通道分别用R、G、B表示,则灰度图Grad为:
Grad(i,j)=0.299*R(i,j)+0.587*G(i,j)+0.114*B(i,j)
S22、计算所述灰度化后图像帧的信息熵:
其中,P(i)是某个像素值i在图像中出现的概率,图像像素值取值范围为0~255。
4.根据权利要求1所述的短视频分类方法,其特征在于,所述短视频张量为N×W×H×C大小,其中N为关键帧的帧数,W对应每个图像帧的宽,H对应每帧图像的高,C对应每帧图像的通道数。
5.根据权利要求4所述的短视频分类方法,其特征在于,所述3D-CNN包括一个硬连线层、三个3D卷积层、两个下采样层一个全连接层、一个输出层;所述硬连线层通过对关键帧进行处理产生多个通道信息;3D卷积层用于提取多种特征;下采样层组件用于对特征进行降维;全连接层用于将二维特征组合成一维特征;输出层包括Softmax分类器,用于基于所述一维特征为短视频分类输出。
6.一种基于优化视频关键帧提取的短视频分类系统,其特征在于,包括:
截帧模块,用于提取短视频密集帧;
信息量计算模块,用于计算所述密集帧中各图像帧的信息量;
关键帧选取模块,用于选取信息量最大的多个图像帧作为所述短视频的关键帧;
分类模块,用于拼接所述关键帧生成短视频张量,将所述短视频张量输入3D-CNN分类模型,基于所述3D-CNN分类模型对所述短视频张量进行特征学习,输出短视频类别。
7.根据权利要求6所述的短视频分类系统,其特征在于,所述密集帧的数量为所述关键帧数量的m倍,m≥2。
8.根据权利要求6所述的短视频分类系统,其特征在于,所述信息量计算模块包括:
灰度化模块,用于对密集帧中各图像帧进行灰度化,彩色图像三个颜色通道分别用R、G、B表示,则灰度图Grad为:
Grad(i,j)=0.299*R(i,j)+0.587*G(i,j)+0.114*B(i,j)
计算模块,用于计算所述灰度化后图像帧的信息熵:
其中,P(i)是某个像素值i在图像中出现的概率,图像像素值取值范围为0~255。
9.根据权利要求6所述的短视频分类系统,其特征在于,所述短视频张量为N×W×H×C大小,其中N为关键帧的帧数,W对应每个图像帧的宽,H对应每帧图像的高,C对应每帧图像的通道数。
10.根据权利要求9所述的短视频分类系统,其特征在于,所述3D-CNN包括一个硬连线层、三个3D卷积层、两个下采样层一个全连接层、一个输出层;所述硬连线层通过对关键帧进行处理产生多个通道信息;3D卷积层用于提取多种特征;下采样层组件用于对特征进行降维;全连接层用于将二维特征组合成一维特征;输出层包括Softmax分类器,用于基于所述一维特征为短视频分类输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州趣维科技有限公司,未经杭州趣维科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911420703.9/1.html,转载请声明来源钻瓜专利网。