[发明专利]视频类型确定方法及装置有效
| 申请号: | 201710818220.9 | 申请日: | 2017-09-12 |
| 公开(公告)号: | CN107609513B | 公开(公告)日: | 2020-06-02 |
| 发明(设计)人: | 杨松 | 申请(专利权)人: | 北京小米移动软件有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
| 地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 类型 确定 方法 装置 | ||
本公开是关于视频类型确定方法,该方法包括:将原视频划分为M段第一子视频;通过第一预设卷积神经网络提取每段第一子视频的图像特征;计算每段第一子视频的光流,通过第二预设卷积神经网络提取光流的特征作为相应段的第一子视频的时序特征;针对任一段第一子视频,整合图像特征和时序特征得到综合特征,通过M段所述第一子视频分别对应的综合特征构成项数为M的特征序列;在原视频中确定N段第二子视频;通过第三预设卷积神经网络对特征序列进行多层的一维卷积运算,运算结果包含N个元素,N个元素与N段第二子视频一一对应;根据概率确定相应第二子视频的类型。根据本公开的实施例确定视频的类型,消耗人力较少,且处理速度更快。
技术领域
本公开涉及终端技术领域,尤其涉及视频类型确定方法、视频类型确定装置、电子设备和计算机可读存储介质。
背景技术
目前对于图像的识别技术已经较为成熟,可以通过现有算法确定图像的类型等参数。
然而目前对于视频的识别,则仍然主要依靠人眼识别,或者通过对视频中的每一帧图像进行识别来实现对视频的识别。其中,通过人眼进行识别,主观性较强,而且消耗人力较多,而若对视频中每一帧图像都进行识别,消耗资源且耗时较长。
发明内容
本公开提供视频类型确定方法、视频类型确定装置、电子设备和计算机可读存储介质,以解决相关技术中的不足。
根据本公开实施例的第一方面,提供一种视频类型确定方法,包括:
将原视频划分为M段第一子视频,其中,M为大于1的整数;
通过第一预设卷积神经网络提取每段所述第一子视频的图像特征;
计算每段所述第一子视频的光流,通过第二预设卷积神经网络提取所述光流的特征作为相应段的所述第一子视频的时序特征;
针对任一段所述第一子视频,整合其图像特征和时序特征得到综合特征,通过M段所述第一子视频分别对应的综合特征构成项数为M的特征序列;
在所述原视频中确定N段第二子视频,其中,N为大于1的整数;
通过第三预设卷积神经网络对所述特征序列进行多层的一维卷积运算,运算结果包含N个元素,所述N个元素与所述N段第二子视频一一对应,其中,所述元素用于指示相应的第二子视频属于每种预设类型的概率;
根据所述概率确定相应第二子视频的类型。
可选地,所述根据所述概率确定相应第二子视频的类型包括:
确定所述第二子视频属于每种预设类型的概率中是否存在大于预设概率的目标概率;
若存在,确定所述第二子视频属于所述目标概率对应的预设类型;
若不存在,确定所述第二子视频属于所述概率中最大概率对应的预设类型。
可选地,所述方法还包括:
接收查询目标类型视频的查询指令;
在所述N段第二子视频中查询属于所述目标类型的多个第二子视频;
若确定的多个第二子视频存在重叠区间,通过非极大值抑制算法对所述多个第二子视频进行处理,以确定所述多个第二子视频中的属于所述目标类型的概率最大的目标第二子视频。
可选地,每段所述第一子视频包含相同数目帧的图像,其中,所述通过第一预设卷积神经网络提取每段所述第一子视频的图像特征包括:
通过第一预设卷积神经网络提取每段所述第一子视频中预设帧的图像。
可选地,所述元素还用于指示相应的第二子视频的区间边界调整量;
所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710818220.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于神经网络的视频人脸捕捉方法
- 下一篇:人脸识别方法及相关产品





