[发明专利]一种基于神经网络和运动矢量的目标检测方法及装置有效
申请号: | 201810385675.0 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108596109B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 王子彤;姜凯;聂林川 | 申请(专利权)人: | 浪潮集团有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/02 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 运动 矢量 目标 检测 方法 装置 | ||
本发明提供了一种目标检测方法及装置,方法包括:解析视频数据码流以提取多帧图像,记录每帧图像的顺序号;针对每帧图像,根据图像的顺序号确定图像是否为帧内预测编码帧,若是,执行A1;否则执行A2至A4;A1:通过神经网络模型对图像进行识别以检测至少一个目标,存储各个目标在图像中的位置信息,在图像中对各个目标进行标记以形成目标图像;A2:根据图像的顺序号确定参考图像,获取对应的运动矢量信息;A3:根据各个目标在参考图像中的位置信息以及运动矢量信息,确定各个目标在图像中的当前位置信息;A4:根据各个目标在图像中的当前位置信息,在图像中对各个目标进行标记以形成目标图像。本发明提供的技术方案,检测效率较高。
技术领域
本发明涉及计算机技术领域,特别涉及一种基于神经网络和运动矢量的目标检测方法及装置。
背景技术
在车载自动驾驶系统中,经常需要对图像采集设备发送的视频数据码流进行相应的解析并识别,以确定并标记出视频数据码流携带的每一帧图像上各个目标(比如,车辆、行人及交通标志等)的位置,实现对视频数据码流所携带的图像进行目标检测。
目前,实现对视频数据码流所携带的图像进行目标检测时,需要通过神经网络模型对视频数据码流所携带的每一帧图像分别进行图像识别,以确定并标记每一帧图像上的至少一个目标,并将标记后的每一帧图像输出。
上述技术方案中,通过神经网络模型对每一帧图像分别进行图像识别消耗时间较长,检测效率较低。
发明内容
本发明实施例提供了一种基于神经网络和运动矢量的目标检测方法及装置,校测效率较高。
第一方面,本发明提供了一种基于神经网络和运动矢量的目标检测方法,包括:
接收图像采集设备发送的视频数据码流;
解析所述视频数据码流以提取至少两帧图像,并记录提取的每一帧所述图像所分别对应的顺序号;
针对于每一帧所述图像,根据所述图像所对应的顺序号确定所述图像是否为帧内预测编码帧,若是,则执行A1;否则,执行A2、A3及A4;
A1:通过神经网络模型对所述图像进行识别以检测出所述图像携带的至少一个目标,确定并存储各个所述目标在所述图像中的位置信息,在所述图像中对各个所述目标的位置进行标记处理以形成目标图像;
A2:根据所述图像所对应的顺序号确定所述图像所对应的参考图像,并获取所述图像对应于所述参考图像的运动矢量信息;
A3:根据各个所述目标在所述参考图像中的位置信息以及所述运动矢量信息,确定各个所述目标在所述图像中的当前位置信息;
A4:根据各个所述目标在所述图像中的当前位置信息,在所述图像中对各个所述目标的位置进行标记处理以形成目标图像。
优选地,
所述根据所述图像所对应的顺序号确定所述图像是否为帧内预测编码帧,包括:
通过如下公式计算所述图像所对应的评价值:
其中,β表征所述评价系数、α表征所述图像所对应的顺序号、n为大于1的预设常数;
当β为整数时,确定所述图像为帧内预测编码帧,否则,确定所述图像为帧间预测编码帧。
优选地,
所述运动矢量信息,包括:整像素运动矢量及帧内预测编码图像块。
第二方面,本发明实施例提供了一种基于神经网络和运动矢量的目标检测装置,包括
码流接收模块,用于接收图像采集设备发送的视频数据码流;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810385675.0/2.html,转载请声明来源钻瓜专利网。