[发明专利]一种视频识别方法、装置、电子设备和存储介质在审
| 申请号: | 202110081599.6 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112784734A | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 吴文灏;赵禹翔 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 识别 方法 装置 电子设备 存储 介质 | ||
1.一种视频识别方法,包括:
将待识别视频分成至少两个视频片段;
从所述视频片段中抽取视频帧并进行特征识别,得到所述视频片段的初始语意特征块;
对各所述初始语意特征块进行融合,得到融合后的目标语意特征块;
基于融合后的目标语意特征块,确定所述待识别视频的类别。
2.根据权利要求1所述的方法,其中,将得到的所述初始语意特征块进行融合,得到融合后的目标语意特征,包括:
基于动态移动策略,将各所述初始语意特征块的不同通道的特征信息进行融合,得到融合后的目标语意特征块。
3.根据权利要求2所述的方法,其中,基于动态移动策略,将各所述初始语意特征块的不同通道的特征信息进行融合,包括:
将当前初始语意特征块的第一通道的特征信息,移动到时序排在所述当前初始语意特征块之前且与所述当前初始语意特征块相邻的初始语意特征块中;
将所述当前初始语意特征块的第二通道的特征信息,移动到时序排在所述当前初始语意特征块之后且与所述当前初始语意特征块相邻的初始语意特征块中。
4.根据权利要求3所述的方法,所述方法还包括:
若所述当前初始语意特征块为时序排在首位的初始语意特征块,则对所述当前初始语意特征块的第二通道进行信息填充;或
若所述当前初始语意特征块为时序排在末尾的初始语意特征块,则对所述当前初始语意特征块的第一通道进行信息填充。
5.根据权利要求1所述的方法,其中,从所述视频片段中抽取视频帧并进行特征识别,得到所述视频片段的初始语意特征块,包括:
从所述视频片段中抽取预设数量的视频帧;
利用预先训练的视频识别网络中的特征提取子网络,对抽取到的视频帧进行特征识别,得到所述视频片段的初始语意特征块。
6.根据权利要求1所述的方法,其中,将待识别视频分成至少两个视频片段,包括:
对所述待识别视频进行平均分段,得到长度相同的至少两个视频片段。
7.一种视频识别装置,包括:
分段模块,用于将待识别视频分成至少两个视频片段;
特征识别模块,用于从所述视频片段中抽取视频帧并进行特征识别,得到所述视频片段的初始语意特征块;
融合模块,用于对各所述初始语意特征块进行融合,得到融合后的目标语意特征块;
识别模块,用于基于融合后的目标语意特征块,确定所述待识别视频的类别。
8.根据权利要求7所述的装置,其中,所述融合模块包括:
动态融合单元,用于基于动态移动策略,将各所述初始语意特征块的不同通道的特征信息进行融合,得到融合后的目标语意特征块。
9.根据权利要求8所述的装置,其中,所述动态融合单元包括:
前移子单元,用于将当前初始语意特征块的第一通道的特征信息,移动到时序排在所述当前初始语意特征块之前且与所述当前初始语意特征块相邻的初始语意特征块中;
后移子单元,用于将所述当前初始语意特征块的第二通道的特征信息,移动到时序排在所述当前初始语意特征块之后且与所述当前初始语意特征块相邻的初始语意特征块中。
10.根据权利要求9所述的装置,还包括:
第一填充模块,用于若所述当前初始语意特征块为时序排在首位的初始语意特征块,则对所述当前初始语意特征块的第二通道进行信息填充;或
第二填充模块,用于若所述当前初始语意特征块为时序排在末尾的初始语意特征块,则对所述当前初始语意特征块的第一通道进行信息填充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081599.6/1.html,转载请声明来源钻瓜专利网。





