[发明专利]一种视频识别方法、装置、电子设备和存储介质在审
| 申请号: | 202110081599.6 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112784734A | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 吴文灏;赵禹翔 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 识别 方法 装置 电子设备 存储 介质 | ||
本申请公开了视频识别方法、装置、电子设备、介质和计算机程序产品,涉及人工智能领域,尤其涉及计算机视觉和深度学习技术。具体实现方案为:将待识别视频分成至少两个视频片段;从视频片段中抽取视频帧并进行特征识别,得到视频片段的初始语意特征块;对各初始语意特征块进行融合,得到融合后的目标语意特征块;基于融合后的目标语意特征块,确定待识别视频的类别。本申请实施例提升了视频识别的精度。
技术领域
本申请涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术,具体涉及一种视频识别方法、装置、电子设备、存储介质和计算机程序产品。
背景技术
视频识别,即输入一段视频根据视频内容对其进行分类。视频识别是计算机视觉社区中最活跃的研究主题之一,这归因于其在视频监视、视频推荐、检索等方面的巨大应用潜力。
发明内容
本申请提供了一种视频识别方法、装置、电子设备、存储介质和计算机程序产品。
根据本申请的一方面,提供了一种视频识别方法,包括:
将待识别视频分成至少两个视频片段;
从视频片段中抽取视频帧并进行特征识别,得到视频片段的初始语意特征块;
对各初始语意特征块进行融合,得到融合后的目标语意特征块;
基于融合后的目标语意特征块,确定待识别视频的类别。
根据本申请的另一方面,提供了一种视频识别装置,包括:
分段模块,用于将待识别视频分成至少两个视频片段;
特征识别模块,用于从视频片段中抽取视频帧并进行特征识别,得到视频片段的初始语意特征块;
融合模块,用于对各初始语意特征块进行融合,得到融合后的目标语意特征块;
识别模块,用于基于融合后的目标语意特征块,确定待识别视频的类别。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意实施例的视频识别方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意实施例的视频识别方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本申请任意实施例的视频识别方法根据本申请的技术,提升了视频识别的精度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的一种视频识别方法的示意图;
图2是根据本申请实施例的一种视频识别方法的示意图;
图3a是根据本申请实施例的一种视频识别方法的示意图;
图3b是根据本申请实施例初始语意特征块的融合过程的效果图;
图4是根据本申请实施例的一种视频识别装置的示意图;
图5是用来实现本申请实施例的视频识别的方法的电子设备的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081599.6/2.html,转载请声明来源钻瓜专利网。





