[发明专利]一种多尺度注意力特征检测方法有效
| 申请号: | 201911189274.9 | 申请日: | 2019-11-28 |
| 公开(公告)号: | CN111079739B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 周书仁 | 申请(专利权)人: | 长沙理工大学 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 长沙智勤知识产权代理事务所(普通合伙) 43254 | 代理人: | 彭凤琴 |
| 地址: | 410000 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 尺度 注意力 特征 检测 方法 | ||
1.一种多尺度注意力特征检测方法,其特征在于,包括:
通过计算机的硬件资源构建单次目标检测器,其中,所述单次目标检测器包括基础网络、新增卷积层和预测层;
在所述新增卷积层上加入多个注意力分支以增强检测特征的特性,并构建并行的多尺度注意力特征检测模型,其中,每个所述注意力分支为:上一层元素点乘检测得到的特征所提供的注意力区域掩膜,每一个所述检测得到的特征包含检测过程中的上层信息和下层信息;
训练所述单次目标检测器;
根据训练所述单次目标检测器而得到的参数训练所述并行的所述多尺度注意力特征检测模型;
将待检测图像输入至所述多尺度注意力特征检测模型,并计算得到检测结果;
所述在所述新增卷积层上加入多个注意力分支以增强检测特征的特性,并构建并行的多尺度注意力特征检测模型,还包括:
将通过共享网络中的下采样层得到的下一个检测特征作为所述注意力分支的输入,其中,所述共享网络包括所述基础网络和所述新增卷积层。
2.一种如权利要求1所述的多尺度注意力特征检测方法,其特征在于,所述注意力分支的沙漏网络的深度设置为1。
3.一种如权利要求1所述的多尺度注意力特征检测方法,其特征在于,所述注意力分支包括特征层,其中,所述特征层的通道的概率值计算公式为:
,
其中,表示之前特征的值,设为1;c表示当前通道,表示第c+1个特征图上(i,j)像素点的特征值,且;C表示该层的特征通道数,表示像素点的通道概率值;
所述特征层的像素点的概率值计算公式为:
,
其中,表示之前特征的值,设为1;表示特征图上(i+1,j+1)像素点的特征值,表示一个通道中不同像素点的加权像素值之和,表示(i,j)像素点的概率值;k表示特征图的大小。
4.一种如权利要求1所述的多尺度注意力特征检测方法,其特征在于,所述多尺度注意力特征检测模型的损失函数包括定位损失和分类损失两部分,计算公式为:
,
其中,为所述损失函数;为所述定位损失,为所述分类损失;N表示匹配的预测框数目,若N为0,则损失设为0;表示定位损失和分类损失的权重,设置为1。
5.一种如权利要求4所述的多尺度注意力特征检测方法,其特征在于,所述定位损失的计算公式为:
,
其中,表示第k类中第i个预测框和第j个预测框的匹配度;表示第i个正预测距离,用边界框直接替换;表示默认框和正确框的距离;表示定位损失,其中,b表示bounding box,即边框,p表示prediction box,即预测出的候选框,t表示groundtruth,即真实边框;pos表示正样本;x、y表示中心点的横坐标和纵坐标,w、h分别表示边框的宽和高。
6.一种如权利要求1所述的多尺度注意力特征检测方法,其特征在于,所述注意力分支的数量为5个。
7.一种如权利要求1所述的多尺度注意力特征检测方法,其特征在于,所述基础网络为VGG-16模型,是一个去除最后两层全连接层的预训练ILSVRC分类模型;所述VGG-16包含5组卷积层。
8.一种如权利要求7所述的多尺度注意力特征检测方法,其特征在于,所述构建单次目标检测器,包括:
以所述新增卷积层的多尺度卷积层作为所述预测层的输入,以两个尺寸相同的卷积核分别用来独立计算分类和定位结果。
9.一种如权利要求8所述的多尺度注意力特征检测方法,其特征在于,所述以两个尺寸相同的卷积核分别用来独立计算分类和定位结果之后,还包括:
通过非极大值抑制来消除高度重复的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911189274.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种矿山用矿石捣碎装置
- 下一篇:一种基于二维码的大容量信息传输方法





