[发明专利]目标位置估计方法及装置、存储介质、终端有效
| 申请号: | 201910038152.3 | 申请日: | 2019-01-15 |
| 公开(公告)号: | CN111291745B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 潘博阳;罗小伟;王森;刘阳;林福辉 | 申请(专利权)人: | 展讯通信(上海)有限公司 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/774;G06V10/771;G06K9/62;G06N3/04;G06N3/08;G06T7/11;G06T7/73 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 武振华;吴敏 |
| 地址: | 201203 上海市浦东新区浦东*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 位置 估计 方法 装置 存储 介质 终端 | ||
1.一种目标位置估计方法,其特征在于,包括以下步骤:
获取前一帧图像通过卷积神经网络中N个卷积层计算后得到的N个特征图,获取当前帧图像通过卷积神经网络中N个卷积层计算后得到的N个特征图,每个特征图的尺寸均一致,且包含多个响应映射,每个响应映射包括响应值及其坐标,其中,N小于等于所述卷积神经网络中的卷积层数目且为正整数,每一帧图像的N个特征图按照生成各个特征图的卷积层的层号倒序排列;
在所述前一帧图像的第一特征图和当前帧图像的第一特征图中,以前一帧图像的目标中心点所在的坐标为中心,分别裁剪预设尺寸的特征图,并采用分类运算得到第一响应映射图,所述第一响应映射图包括多个响应映射,所述第一特征图是最后一个卷积层计算生成的特征图;
确定所述第一响应映射图中响应值最大的响应映射的坐标,以作为第一目标中心;
在所述前一帧图像的第一特征图和当前帧图像的第一特征图中,以所述第一目标中心为中心,分别裁剪预设尺寸的特征图,并采用分类算法得到第一候选响应映射图,所述第一候选响应映射图包括多个响应映射;
在所述前一帧图像的第二特征图和当前帧图像的第二特征图中,以所述第一目标中心为中心,分别裁剪预设尺寸的特征图,并采用分类算法得到第二响应映射图,所述第二响应映射图包括多个响应映射;
采用第一预设权重值,对所述第一候选响应映射图以及所述第二响应映射图的响应映射进行加权求和,以得到第二融合响应映射图;
确定所述第二融合响应映射图中响应值最大的响应映射的坐标,以作为第二目标中心;
对于所述前一帧图像的第二至第N特征图,分别计算得到每一特征图对应的候选响应映射图,其中,对于所述前一帧图像的第n特征图和当前帧图像的第n特征图,以第n目标中心为中心,分别裁剪预设尺寸的特征图,并采用分类算法得到第n候选响应映射图,所述第n候选响应映射图包括多个响应映射,其中,1<n<N且n为正整数;
对于所述前一帧图像的第二至第N特征图,分别计算得到每一特征图对应的响应映射图,其中,对于所述前一帧图像的第n+1特征图和当前帧图像的第n+1特征图,以所述第n目标中心为中心,分别裁剪预设尺寸的特征图,并采用分类算法得到第n+1响应映射图,所述第n+1响应映射图包括多个响应映射;
对于所述前一帧图像的第二至第N特征图,分别计算得到每一特征图对应的融合响应映射图,其中,采用第n预设权重值,对所述第n候选响应映射图以及所述第n+1响应映射图的响应映射进行加权求和,以得到第n+1融合响应映射图;
确定响应值最大的所述第n+1融合响应映射图中的响应映射的坐标,以作为第n+1目标中心;
当n+1与N相等时,确定所述第n+1目标中心为所述当前帧图像中的目标位置。
2.根据权利要求1所述的目标位置估计方法,其特征在于,所述获取前一帧图像通过卷积神经网络中N个卷积层计算后得到的N个特征图,获取当前帧图像通过卷积神经网络中N个卷积层计算后得到的N个特征图包括:
分别获取前一帧图像通过卷积神经网络中N个卷积层后得到的特征图;
分别获取当前帧图像通过卷积神经网络中N个卷积层后得到的特征图;
将所述前一帧图像的N个特征图和当前帧图像的N个特征图分别缩放至预设特征图尺寸。
3.根据权利要求2所述的目标位置估计方法,其特征在于,采用双线性插值法或三线性插值法将所述前一帧图像的N个特征图和当前帧图像的N个特征图分别缩放至预设特征图尺寸。
4.根据权利要求1所述的目标位置估计方法,其特征在于,在所述前一帧图像的第一特征图和当前帧图像的第一特征图中,以前一帧图像的目标中心点所在的坐标为中心,分别裁剪预设尺寸的特征图,并采用分类运算得到第一响应映射图包括:
在所述前一帧图像的第一特征图中,采用预设尺寸的第一目标窗口,以前一帧图像中目标中心点所在的坐标为中心,裁剪预设尺寸的第一目标特征图;
在所述当前帧图像的第一特征图中,采用预设尺寸的第一搜索窗口,以前一帧图像中目标中心点所在的坐标为中心,裁剪预设尺寸的第一搜索特征图;
将所述第一目标特征图以及所述第一搜索特征图分别输入分类器进行分类运算,以得到第一响应映射图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910038152.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:同步源信息的确定、指示方法及装置、存储介质、终端
- 下一篇:一种潜水器





