[发明专利]视频识别及训练方法和装置、电子设备、程序和介质有效
| 申请号: | 201711329718.5 | 申请日: | 2017-12-13 |
| 公开(公告)号: | CN108229336B | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 何唐从睿;秦红伟 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T5/50 |
| 代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
| 地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 识别 训练 方法 装置 电子设备 程序 介质 | ||
1.一种视频识别方法,其特征在于,包括:
提取视频中第一关键帧的特征;
将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合,获得所述第一关键帧的融合特征;其中,所述第二关键帧在所述视频中的检测时序位于所述第一关键帧之前;第二关键帧的融合特征由所述第二关键帧的特征和所述视频中检测时序位于所述第二关键帧之前的第三关键帧的融合特征进行融合处理获得;所述视频中的关键帧为基于每多帧选取一帧的方式从所述视频中选取的帧,所述关键帧包括所述第一关键帧、所述第二关键帧和所述第三关键帧;
根据所述第一关键帧的融合特征对所述第一关键帧进行检测,获得所述第一关键帧的物体检测结果。
2.根据权利要求1所述的方法,其特征在于,所述第二关键帧包括所述第一关键帧在所述视频中相邻的前一关键帧。
3.根据权利要求1所述的方法,其特征在于,将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合之前,还包括:
获取所述第一关键帧与所述第二关键帧之间的光流场;
根据所述第一关键帧与所述第二关键帧之间的光流场,将所述第二关键帧的融合特征与所述第一关键帧对齐;
将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合,包括:将对齐后的所述第二关键帧的融合特征与所述第一关键帧的特征进行融合。
4.根据权利要求1-3任一所述的方法,其特征在于,将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合,包括:
确定所述第一关键帧的特征与所述视频中第二关键帧的融合特征的权重系数;
根据所述第一关键帧的特征与所述视频中第二关键帧的融合特征的权重系数,将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合。
5.根据权利要求1-3任一所述的方法,其特征在于,所述提取视频中第一关键帧的特征之后,还包括:
确定所述第一关键帧是否所述视频中的第一个关键帧;
响应于所述第一关键帧是所述视频中的第一个关键帧,根据所述第一个关键帧的特征,获得所述第一个关键帧的物体检测结果;
否则,响应于所述第一关键帧不是所述视频中的第一个关键帧,执行所述将所述第一关键帧的特征与所述视频中第二关键帧的融合特征进行融合的操作。
6.根据权利要求1-3任一所述的方法,其特征在于,还包括:
从所述视频中选取所述第一关键帧。
7. 根据权利要求6所述的方法,其特征在于,从所述视频中选取所述第一关键帧,包括:
从所述视频中随机选取一个帧作为所述第一关键帧;或者
从所述视频中每隔若干帧选取一个帧作为所述第一关键帧;或者
将所述视频拆分为多个短视频序列,并分别从每个短视频序列中选取一个帧作为所述每个短视频序列的关键帧,所述多个短视频序列的关键帧包括所述第一关键帧;或者
从所述视频中选取一个短视频序列,并从选取的短视频序列中选取一个帧作为所述第一关键帧。
8. 根据权利要求7所述的方法,其特征在于,从短视频序列中选取一个帧作为所述第一关键帧,包括:
从短视频序列中随机选取一个帧作为所述第一关键帧;或者
选取所述短视频序列中的一个中间帧作为所述第一关键帧;其中,所述中间帧包括该中间帧所在所述短视频序列中除首帧与末帧外的帧。
9.根据权利要求8所述的方法,其特征在于,所述中间帧包括:该中间帧所在所述短视频序列中位置居中或临近居中位置的帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711329718.5/1.html,转载请声明来源钻瓜专利网。





