[发明专利]视频特征提取方法及应用该方法的视频量化方法在审
| 申请号: | 202010771697.8 | 申请日: | 2020-08-04 |
| 公开(公告)号: | CN111897995A | 公开(公告)日: | 2020-11-06 |
| 发明(设计)人: | 宋井宽;郎睿敏;朱筱苏;高联丽 | 申请(专利权)人: | 成都井之丽科技有限公司;电子科技大学 |
| 主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/783;G06F17/16;G06N3/04 |
| 代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 陈泽斌 |
| 地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 特征 提取 方法 应用 量化 | ||
1.视频特征提取方法,其特征在于,包括:
从目标视频中提取原始视觉特征并构建原始特征矩阵,所述原始特征矩阵包含每帧采样图像的空间信息和每帧采样图像之间的时序信息;
根据原始特征矩阵生成采样图像空间注意力热度图和采样图像时序注意力热度图;以及
将原始特征矩阵、采样图像空间注意力热度图、采样图像时序注意力热度图相加融合得到目标特征矩阵。
2.如权利要求1所述的视频特征提取方法,其特征在于,
A)根据原始特征矩阵生成采样图像空间注意力热度图包括:
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一行的其他所有像素点之间信息依赖关系的行维度注意力热度图;和
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一列的其他所有像素点之间信息依赖关系的列维度注意力热度图;
并且/或者,
B)根据原始特征矩阵生成采样图像时序注意力热度图包括:
根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一时序的其他所有像素点之间信息依赖关系的时序维度注意力热度图。
3.如权利要求2所述的视频特征提取方法,其特征在于:
若设目标视频的原始特征矩阵oi∈RT′×h×w×c,其中h为视频每帧图像的高度、w为视频每帧图像的宽度、c为视频每帧图像的通道数、T′为采样图像帧数,则
A)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一行的其他所有像素点之间信息依赖关系的行维度注意力热度图包括:
将原始特征矩阵重塑为{T′×h}×w×c;分别采用三个尺寸为c*1*1的卷积核对重塑后的矩阵进行卷积操作,得到三个维度均为{T′×h}×w×c的特征矩阵rθ,rρ,rγ,其中c*1*1为通道数*高度*宽度;将所述三个特征矩阵rθ,rρ,rγ按公式进行运算,得到行维度注意力热度图r,其中是特征矩阵rγ的转置矩阵;
并且/或者,
B)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一列的其他所有像素点之间信息依赖关系的列维度注意力热度图包括:
将原始特征矩阵重塑为{T′×w}×h×c;分别采用三个尺寸为c*1*1的卷积核对重塑后的矩阵进行卷积操作,得到三个维度均为{T′×w}×h×c的三个特征矩阵cθ,cρ,cγ,其中c*1*1为通道数*高度*宽度;将所述三个特征矩阵cθ,cρ,cγ按公式进行运算,得到列维度注意力热度图c,其中为特征矩阵cγ的转置矩阵;
并且/或者,
C)根据原始特征矩阵生成表示每帧采样图像中每个像素点和与该像素点处于同一时序的其他所有像素点之间信息依赖关系的时序维度注意力热度图包括:
将原始特征矩阵重塑为{w×h}×T′×c;分别采用三个1*1的卷积核对重塑后的矩阵进行卷积操作,得到维度均为{w×h}×T′×c的三个特征矩阵tθ,tρ,ty;将所述三个特征矩阵tθ,tρ,tγ按公式进行运算,得到时序维度注意力热度图t,其中为特征矩阵tγ的转置矩阵。
4.视频量化方法,其特征在于,包括:
根据权利要求1、2或3所述的视频特征提取方法得到目标特征矩阵;
将目标特征矩阵转变为代表目标视频的特征向量;以及
将特征向量压缩成二进制编码实现视频量化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都井之丽科技有限公司;电子科技大学,未经成都井之丽科技有限公司;电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010771697.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种零件内孔磨削装置
- 下一篇:姿态估计方法、装置、电子设备和存储介质





