[发明专利]基于结构自适应和规模自适应感受野的显著性检测方法有效
| 申请号: | 202011223925.4 | 申请日: | 2020-11-05 |
| 公开(公告)号: | CN112329793B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 刘婧;苏育挺;严昌飞 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06N3/04;G06N3/08 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 结构 自适应 规模 感受 显著 检测 方法 | ||
1.一种基于结构自适应和规模自适应感受野的显著性检测方法,其特征在于,所述方法包括:
对DUTS数据库中训练集图像进行水平镜像处理,将镜像处理后的图像和标签加入到训练集;
构建由骨干网络、特征提取网络和聚合网络构成网络模型;
将训练集的低比特图像反量化后得到的零填充高比特图像作为网络模型的输入,将各层次输出结果和真实的标签图之间的二值交叉熵损失作为损失函数,通过Adam优化器梯度下降损失函数训练网络模型的各个参数;将训练后的网络模型用于显著性检测;
其中,
骨干网络:使用VGG-16模型,将VGG-16模型的第2个卷积块的第2层Conv2-2、第3个卷积块的第2层Conv3-2、第4个卷积的第3层Conv4-3和第5个卷积块的第3层Conv5-3和最后一个池化层作为五个层次特征输入到特征提取网络中;
特征提取网络:Conv2-2输出的特征仅用两个3×3卷积提取,剩余层次特征先使用传统卷积和变形卷积处理,再用空间文本模块提取上下文信息,使用通道注意力模块强化空间文本模块处理后的特征;对AvgPool层空间文本模块处理后的特征使用全局均值池化和线性插值获得全局特征,将处理后的特征和全局特征进行拼接整合;
聚合网络:对特征提取网络输出的特征进行聚合生成各层次显著预测结果,不同层次特征使用反卷积或下采样调整分辨率进行聚合,聚合后的特征使用边缘改善模块,使用线性插值将分辨率调整到标签图像的尺寸,使用深监督对每个层次预测图及结合图进行监督训练,完成端到端的训练;
所述上下文信息为:
其中,k代表卷积核尺寸,d代表卷积核扩张比率,i代表Conv3-2、Conv4-3、Conv5-3和AvgPool层,Conv3-2,设置X1=[X1,1,X3,1];对于Conv4-3,设置X2=[X1,1,X3,1,X3,2];对于Conv5-3,设置X3=[X1,1,X3,1,X3,2];对于AvgPool,设置X4=[X1,1,X3,1,X3,2,X3,3]。
2.根据权利要求1所述的一种基于结构自适应和规模自适应感受野的显著性检测方法,其特征在于,所述使用通道注意力模块强化空间文本模块处理后的特征具体为:将变形特征图输入通道注意力模块中生成通道权重,将通道权重与该层Xi点乘,强化显著性相关的通道,权重W获得公式为:
W=Fc(reshape(pool(D)))
其中,D为当前层的通过变形卷积处理后的变形特征图,pool(·)为均值池化操作,将D的调整到C×n×n尺寸,C为特征通道数目,reshape(·)将特征图调整到Cn2×1×1,Fc(·)代表全连接层。
3.根据权利要求1所述的一种基于结构自适应和规模自适应感受野的显著性检测方法,其特征在于,所述方法还包括:将全局特征与AvgPool层的特征拼接,Conv2-2和Conv3-2的特征拼接。
4.根据权利要求1所述的一种基于结构自适应和规模自适应感受野的显著性检测方法,其特征在于,所述边缘改善模块由Relu函数和Conv组成,具体为:
Pout=Pin+F(F(Pin))
其中,Pin代表输入的原始预测结果,Pout代表经过模块处理后的预测结果,F(·)函数是Relu函数加3×3卷积操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011223925.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高校学生行为分析系统、方法、设备及介质
- 下一篇:一种用于生鲜输送的物流系统





