[发明专利]一种基于多尺度匹配策略深度特征学习的目标检测方法在审

申请号：	202010564966.3	申请日：	2020-06-19
公开（公告）号：	CN111723737A	公开（公告）日：	2020-09-29
发明（设计）人：	董永生;张智勇;吴庆涛;裴远桦;郑博士;蒋志强;刘晴;谭伟;郑林涛;王琳	申请（专利权）人：	河南科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司：	洛阳公信知识产权事务所(普通合伙) 41120	代理人：	宋晨炜
地址：	471000 河***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于尺度匹配策略深度特征学习目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种基于多尺度匹配策略深度特征学习的目标检测方法，基于残差神经网络，我们首先对不同类目标的宽高比进行聚类，并进一步使用多尺度匹配策略来选择默认框，缓解目标遮挡问题。然后，融合不同深度的特征图以检测不同尺度的物体。实验结果表明，与当前九种具有代表性的目标检测方法相比，我们提出的方法更具竞争力，速度更快，精度更高。

技术领域

本发明涉及计算机视觉和模式识别技术领域，，具体说的是一种基于多尺度匹配策略深度特征学习的目标检测方法。

背景技术

目标检测是从图像或视频中找到感兴趣的目标。人们的视觉系统可以从图像或视频中快速准确地捕捉到目标类型、位置以及各目标之间的相对关系。它可以帮助我们完成一些复杂的任务，例如运动和驾驶汽车。在过去的几十年中，多种目标检测算法已经被提出，它们可以分为两类：传统的目标检测算法和基于深度学习的目标检测算法。

早期的目标检测算法主要基于手动构建的特征。由于当时缺乏有效的可视化技术，人们只能设计复杂的特征表示并不断对其进行优化。基于深度学习的方法，通过不断加深网络的深度让计算机自动提取特征，不需要复杂的特征表示，从而在近些年不断刷新计算机视觉领域的各项记录。

但是，这两种方法都不能很好的检测小目标以及被遮挡的目标。

发明内容

为解决上述技术问题，本发明提供一种基于多尺度匹配策略深度特征学习的目标检测方法，速度更快，精度更高。

为实现上述技术目的，所采用的技术方案是：一种基于多尺度匹配策略深度特征学习的目标检测方法，包括以下步骤：

步骤一：聚类目标宽高比，划分单元格

首先对数据集中所有具有真实框的被检测目标按照类别对宽高比进行聚类，得到所有类别默认框的宽高比信息，随后将数据集中每一张整幅图像按S*S个单元格进行划分，13≤S≤26；

步骤二：多尺度匹配默认框，学习偏移量，得到预测框

计算被检测目标的中心坐标，提取其所在单元格的直实框信息，将所有默认框依次与被检测目标的真实框进行比对，选择具有最大IoU值的默认框，并按照以下公式计算偏移量，得到预测框；

b_x＝c_x+p_x

b_y＝c_y+p_y

b_f＝p(b,obj)*p_f

其中，b_x，b_y，b_w，b_h，b_f分别表示预测框的横坐标、纵坐标、宽、高以及包含目标的自信度，p_x，p_y，p_w，p_h，p_f分别表示残差神经网络输出的横坐标、纵坐标、宽、高的偏移量和自信度，c_x，c_y，c_w，c_h分别表示默认框的横坐标、纵坐标、宽和高，p(b,obj)为示性函数，当输出的p_f高于阈值t时，0.5≤t≤0.7， p(b,obj)为1，否则为0；

步骤三：多深度特征融合，检测多尺度目标

对整个残差神经网络的多个深度提取特征并进行融合后，并对整个残差神经网络的进行优化，对步骤二得到的预测框与真实框使用均方误差进行误差计算；

步骤四：进行训练

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河南科技大学，未经河南科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010564966.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于虹膜识别的车辆控制装置及使用方法
下一篇：用药依从性管理方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度匹配策略深度特征学习的目标检测方法在审

专利文献下载