[发明专利]基于多层特征融合的Faster R-cnn上下文机制优化方法在审

专利信息
申请号: 202211470255.5 申请日: 2022-11-23
公开(公告)号: CN116189027A 公开(公告)日: 2023-05-30
发明(设计)人: 万久地;潘纯洁;张前进 申请(专利权)人: 中国铁塔股份有限公司重庆市分公司
主分类号: G06V20/40 分类号: G06V20/40;G06V20/52;G06V10/764;G06V10/766;G06V10/80;G06V10/82;G06N3/045;G06N3/0464
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 方钟苑
地址: 401120 重庆*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多层 特征 融合 faster cnn 上下文 机制 优化 方法
【说明书】:

发明涉及一种基于多层特征融合的Faster R‑cnn上下文机制优化方法,属于目标识别技术领域。该方法在传统的使用HyperNet提取预选框特征向量的基础上,将基于不同于传统方式改进的多层特征融合模块加入模型中,对图像不同层次的语义信息进行提取;并将传统采样方式改进为反池化,避免棋盘化问题;然后,将得到的特征向量与上下文注意力机制融合得到多信息特征向量,最终进行识别分类。本发明能提高模型对于识别静止不动物体的正确率。

技术领域

本发明属于目标识别技术领域,涉及一种优化的上下文机制(基于多层特征融合的Faster R-cnn上下文机制)的目标检测方法。

背景技术

在一些高空监控的场景中,一些无源监控对于环境的捕捉在很长一段时间内是处于静态的,处于静态的摄像头捕捉到的画面相比于动态摄像头有捕捉到的画面在每一帧的分别上更具有长期的高度一致性。在捕捉到的视野中,处于不同月份不同天数的画面可能也具有十分的相似性,例如,轨道交通摄像头用于捕捉画面,在对收集到的画面进行分析处理时,尝试用距离这些画面相近的一段时间内的相关信息来帮助决定以及判断当前情况下的情境。这些通过包含过去记忆数据的注意力机制来完成。

视频目标检测架构建立在单帧模型之上,并通过合并来拟合其他帧的上下文线索(如传统HyperNet方式),来处理视频数据中其余的问题,例如运动模糊、遮挡和罕见的姿势。这类处理方法有类似流的概念来聚合特征,或者使用相关性将当前时间步上的特征和相邻时间步紧密关联。上述大多数的视频检测方法都不太适合目标设置稀疏、不规则帧率的问题。例如,基于流的方法、3d卷积以及LSTMs这些通常比较密集、规则的帧率采样方法。

传统HyperNet方式。cnn通过输入图像进行提取特征,得到对应feature maps,对其输入rpn网络后产生得到对应的候选框,并实现对候选框的分类,分类包含对候选框内内容进行判别,判别其是图片背景还是另外前景内容,判别后剔除背景候选内容,只取前景。但是传统方式中,浅层信息中的特征语义信息薄弱,并不能完整的描述对于小目标的表达,而采用上采样的方式对特征图采样后与其他层特征融合,这一方式不仅会导致信息的遗失和遗漏,不利于对于小目标的检测,影响算法对于不同目标的检测速度。

反卷积,作为卷积层中的上采样方法,又被称作转置卷积。作为传统的卷积方式,它会在得到产生的图像中导致棋盘效应。因此在上采样方法中用反池化的方法替代,使棋盘化效应得到解决。

因此,亟需一种新的上下文机制优化方案来解决现有静态视频目标检测不准确的问题。

发明内容

有鉴于此,本发明的目的在于提供一种基于多层特征融合的Faster R-cnn上下文机制优化方法,利用静态摄像机的长期位置不发生改变的特点,使用一种特征冻结方式创建长期的记忆库,存储受探测者长期以来的习惯性行为。在结构中增加短期注意力机制,将正例和假正例也加入进学习的范围之内,修正识别结果,提高模型对于识别静止不动物体的正确率。

为达到上述目的,本发明提供如下技术方案:

一种基于多层特征融合的Faster R-cnn上下文机制优化方法,在传统的使用HyperNet提取预选框特征向量的基础上,将基于不同于传统方式改进的多层特征融合模块加入模型中,对图像不同层次的语义信息进行提取;并将传统采样方式改进为反池化,避免棋盘化问题。然后,将得到的特征向量与上下文注意力机制融合得到多信息特征向量,最终进行识别分类。

该方法具体包括以下步骤:

S1:将当前关键帧与相关上下文帧输入多层特征融合模块,对其提取预选框特征向量;

S2:多层特征融合模块中卷积层深层次采用反池化进行上采样;

S3:对于通过多层特征融合模块输出的当前关键帧与相关上下文帧的预选框特征向量,将其分别输入到注意力模块和构建短期记忆库的模块中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国铁塔股份有限公司重庆市分公司,未经中国铁塔股份有限公司重庆市分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211470255.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top