[发明专利]视频图像处理方法及装置、计算机可读介质和电子设备有效
申请号: | 201810639496.5 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108960090B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 王亚彪;甘振业;何长伟;汪铖杰;李季檩 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/62;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 图像 处理 方法 装置 计算机 可读 介质 电子设备 | ||
1.一种视频图像处理方法,其特征在于,包括:
获取视频中当前帧图像中的目标对象位置区域;
获取当前帧的下一帧图像,并基于所述当前帧图像的目标对象位置区域在所述下一帧图像中获取目标对象跟踪图像;
对所述目标对象跟踪图像的分辨率进行调整,以使所述目标对象跟踪图像与跟踪神经网络输入要求的分辨率适配;
采用跟踪神经网络对所述目标对象跟踪图像依次进行多组卷积处理以确定所述下一帧图像中的目标对象位置区域;其中,所述跟踪神经网络包括多个堆叠的卷积块,每个卷积块执行一组卷积处理,所述多个堆叠的卷积块中第一个卷积块包括1个卷积层,除所述第一个卷积块外的其他卷积块均包括2个卷积层,所述第一个卷积块中的卷积层包括8个大小为7×7且步长为4的卷积核,第二个卷积块中的卷积层包括16个大小为3×3且步长为1的卷积核以及24个3×3且步长为1的卷积核,第三个卷积块中的卷积层包括40个大小为3×3且步长为1的卷积核以及60个大小为3×3且步长为1的卷积核;
如果所述下一帧图像与最近识别一帧图像间隔预定数目帧且跟踪到目标对象,则采用深度残差网络对所述下一帧图像的目标对象位置区域中的目标对象进行识别,以确定所述目标对象的类别,其中,所述深度残差网络采用3个卷积核;
如果未跟踪到目标对象,则将所述下一帧图像作为当前帧图像,并重新执行将所述当前帧图像的特征图输入基础神经网络进行处理以确定所述当前帧图像中的目标对象位置区域的步骤及之后的步骤。
2.根据权利要求1所述的视频图像处理方法,其特征在于,所述视频图像处理方法还包括:
确定所述下一帧图像中的目标对象位置区域包含目标对象的置信度;
将所述置信度与一预定阈值进行比较;
如果所述置信度小于所述预定阈值,则在所述下一帧图像中识别目标对象。
3.根据权利要求1所述的视频图像处理方法,其特征在于,基于所述当前帧图像的目标对象位置区域在所述下一帧图像中获取目标对象跟踪图像包括:
将所述当前帧图像的目标对象位置区域放大预定倍数得到目标对象跟踪区域;
将所述下一帧图像中与所述目标对象跟踪区域对应的图像确定为目标对象跟踪图像。
4.根据权利要求1所述的视频图像处理方法,其特征在于,每个卷积块包括卷积层和最大池化层。
5.根据权利要求4所述的视频图像处理方法,其特征在于,所述跟踪神经网络还包括在第三个卷积块与所述跟踪神经网络的输出之间依次配置的维度为96的内积层和维度为128的内积层。
6.根据权利要求2所述的视频图像处理方法,其特征在于,针对所述确定所述目标对象跟踪图像中包含目标对象的置信度,所述视频图像处理方法还包括:
根据所述置信度计算第一损失函数;
确定使第一损失函数最小化的跟踪神经网络参数;
根据使第一损失函数最小化的跟踪神经网络参数对所述跟踪神经网络进行调整。
7.根据权利要求1或6所述的视频图像处理方法,其特征在于,针对所述跟踪神经网络确定出下一帧图像的目标对象位置区域,所述视频图像处理方法还包括:
根据所述下一帧图像的目标对象位置区域计算第二损失函数;
确定使第二损失函数最小化的跟踪神经网络参数;
根据使第二损失函数最小化的跟踪神经网络参数对所述跟踪神经网络进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810639496.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种茶树林遥感监测的方法及装置
- 下一篇:监控系统、方法、可读存储介质及汽车
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序