[发明专利]一种基于多尺度匹配策略深度特征学习的目标检测方法在审

申请号：	202010564966.3	申请日：	2020-06-19
公开（公告）号：	CN111723737A	公开（公告）日：	2020-09-29
发明（设计）人：	董永生;张智勇;吴庆涛;裴远桦;郑博士;蒋志强;刘晴;谭伟;郑林涛;王琳	申请（专利权）人：	河南科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司：	洛阳公信知识产权事务所(普通合伙) 41120	代理人：	宋晨炜
地址：	471000 河***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于尺度匹配策略深度特征学习目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多尺度匹配策略深度特征学习的目标检测方法，其特征在于：包括以下步骤，

步骤一：聚类目标宽高比，划分单元格

首先对数据集中所有具有真实框的被检测目标按照类别对宽高比进行聚类，得到所有类别默认框的宽高比信息，随后将数据集中每一张整幅图像按S*S个单元格进行划分，13≤S≤26；

步骤二：多尺度匹配默认框，学习偏移量，得到预测框

计算被检测目标的中心坐标，提取其所在单元格的直实框信息，将所有默认框依次与被检测目标的真实框进行比对，选择具有最大IoU值的默认框，并按照以下公式计算偏移量，得到预测框；

b_x＝c_x+p_x

b_y＝c_y+p_y

b_f＝p(b,obj)*p_f

其中，b_x，b_y，b_w，b_h，b_f分别表示预测框的横坐标、纵坐标、宽、高以及包含目标的自信度，p_x，p_y，p_w，p_h，p_f分别表示残差神经网络输出的横坐标、纵坐标、宽、高的偏移量和自信度，c_x，c_y，c_w，c_h分别表示默认框的横坐标、纵坐标、宽和高，p(b,obj)为示性函数，当输出的p_f高于阈值t时，0.5≤t≤0.7，p(b,obj)为1，否则为0；

步骤三：多深度特征融合，检测多尺度目标

对整个残差神经网络的多个深度提取特征并进行融合后，并对整个残差神经网络的进行优化，对步骤二得到的预测框与真实框使用均方误差进行误差计算；

步骤四：进行训练

利用步骤三优化后的残差神经网络进行训练，在整个训练过程中，使用的批次大小为z,2≤z≤32，动量为m,0.5≤m≤0.9，衰减速率为v，0.0001≤v≤0.0008，在训练过程中使用随机丢弃和数据增强功能，整个训练过程的初始学习率为10^-2，随后按照10^-1的速度衰减并训练e个周期，120≤e≤150；

步骤五：绘制预测框

训练完成后，提取经过训练之后的残差神经网络的输出来绘制预测框，完成目标检测。

2.如权利要求1所述的一种基于多尺度匹配策略深度特征学习的目标检测方法，其特征在于：数据集采用为PASCAL VOC数据集。

3.如权利要求1所述的一种基于多尺度匹配策略深度特征学习的目标检测方法，其特征在于：预测框与真实框使用均方误差进行误差计算的公式为，

其中，S表示划分的单元格数量，N表示默认框的数量，x_ij，y_ij，w_ij，h_ij，f_ij分别表示第i个单元格第j个默认框中真实框的横坐标、纵坐标、宽、高以及类别概率，分别表示第i个单元格第j个默认框中预测框的横坐标、纵坐标、宽、高以及类别概率，i＝1,2,…,S，j＝1,2,…,N，设置α等于0.1来平衡正负样本，和均为示性函数，表示第i个单元格第j个默认框是否包含目标，如果高于阈值t，为1，为0，否则相反。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河南科技大学，未经河南科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010564966.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于虹膜识别的车辆控制装置及使用方法
下一篇：用药依从性管理方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度匹配策略深度特征学习的目标检测方法在审

专利文献下载