[发明专利]基于动态记忆和运动感知的目标检测方法及系统有效
| 申请号: | 201811028891.6 | 申请日: | 2018-09-05 |
| 公开(公告)号: | CN109191498B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 廖胜才;刘威 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 动态 记忆 运动 感知 目标 检测 方法 系统 | ||
1.一种基于动态记忆和运动感知的目标检测方法,其特征在于包括:
利用预先构建的神经网络获取目标视频中当前帧图像对应的多个不同分辨率的特征图,并且获取每个所述特征图对应的目标候选框;
根据所述分辨率最大的特征图和预先获取的前一帧图像对应的所述目标视频的动态记忆特征图,获取当前帧对应的动态记忆特征图;
根据所述当前帧图像对应的动态记忆特征图和所述分辨率最大的特征图,获取所述当前帧图像的运动特征图;
将所述分辨率最大的特征图与所述运动特征图进行特征融合得到融合特征图;
根据所述融合特征图获取每个所述目标候选框的融合特征;
利用所述神经网络并且根据预设的目标类别与所述融合特征,预测相应目标候选框对应的目标类别以及所述目标候选框在当前帧图像中对应的位置信息。
2.根据权利要求1所述的基于动态记忆和运动感知的目标检测方法,其特征在于,在“根据所述分辨率最大的特征图和预先获取的前一帧图像对应的所述目标视频的动态记忆特征图,获取当前帧对应的动态记忆特征图”的步骤之前,所述方法还包括:
按照下式所示的方法对所述分辨率最大的特征图进行增强处理:
其中,所述cn、cn+1分别表示所述神经网络中第n层、第n+1层卷积层,所述φn、φn+1分别表示所述cn、cn+1对应的特征图,所述是所述φn增强后的特征图,所述dn+1表示与所述cn连接的反卷积层,所述表示逐元素求和操作。
3.根据权利要求2所述的基于动态记忆和运动感知的目标检测方法,其特征在于,“根据所述分辨率最大的特征图和预先获取的前一帧图像对应的所述目标视频的动态记忆特征图,获取当前帧对应的动态记忆特征图”的步骤包括:
按照下式所示的方法获取所述当前帧对应的动态记忆特征图:
Mk=(1-β)φk+βMk-1
其中,所述Mk和Mk-1分别是第k和k-1帧对应的动态记忆特征图,所述φk是第k帧图像对应的所述分辨率最大的特征图,所述β是预设的动量系数。
4.根据权利要求3所述的基于动态记忆和运动感知的目标检测方法,其特征在于,“根据所述当前帧图像对应的动态记忆特征图和所述分辨率最大的特征图,获取所述当前帧图像的运动特征图”的步骤包括:
按下式所示的方法计算当前帧图像的运动特征图:
其中,所述是所述目标视频中第k帧图像对应的运动特征图,所述Mk是所述目标视频中第k帧图像对应的动态记忆特征图,所述φk是所述目标视频中第k帧图像对应的所述分辨率最大的特征图并且所述Mk与所述φk的分辨率大小一致,所述diff(Mk,φk)表示将所述Mk中的每个元素与所述φk中对应位置的元素求差值。
5.根据权利要求4所述的基于动态记忆和运动感知的目标检测方法,其特征在于,“将所述分辨率最大的特征图与所述运动特征图进行特征融合得到融合特征图”的步骤包括:
基于所述分辨率最大的特征图与所述运动特征图,并且按照下式所示的方法得到融合特征图:
其中,所述ηk是所述目标视频中第k帧图像对应的融合特征图,所述“Concat()”表示特征串联操作,所述“Conv()”表示用于特征压缩的卷积层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811028891.6/1.html,转载请声明来源钻瓜专利网。





